나는 hadoop에서 초보자이며 하이브의 테이블에 데이터를 추가해야합니다. 나는 9=66
9, 해당 컬럼의 값으로 열 이름으로 8=FIX.4.4
8, FIX4.4 프로토콜이 같은 ... 첫째다음 시나리오에서 테이블에 데이터를 삽입하는 방법은 무엇입니까?
8=FIX.4.4<SHO>9=85<SHO>35=A<SHO>34=524<SHO>49=SSGMdemo<SHO>52=20150410-15:25:55.795<SHO>56=Trumid<SHO>98=0<SHO>108=30<SHO>554=TruMid456<SHO>10=154<SHO>
8=FIX.4.4<SHO>9=69<SHO>35=A<SHO>34=1<SHO>49=Trumid<SHO>52=20150410-15:25:58.148<SHO>56=SSGMdemo<SHO>98=0<SHO>108=30<SHO>10=093<SHO>
8=FIX.4.4<SHO>9=66<SHO>35=2<SHO>34=2<SHO>49=Trumid<SHO>52=20150410-15:25:58.148<SHO>56=SSGMdemo<SHO>7=1<SHO>16=0<SHO>10=174<SHO>
8=FIX.4.4<SHO>9=110<SHO>35=5<SHO>34=525<SHO>49=SSGMdemo<SHO>52=20150410-15:25:58.164<SHO>56=Trumid<SHO>58=MsgSeqNum too low, expecting 361 but received 1<SHO>10=195<SHO>
, 내가 원하는 것은 데이터를 가지고 있고, FIX.4.4 컬럼 이름이어야하고 66은 그 컬럼의 값이 될 것입니다. 그리고 .... 이와 같이 원시 파일에는 많은 행이 있습니다.
둘째, 다른 행에 대해 동일한 작업을 수행하고 해당 데이터가 하이브에있는 테이블의 다음 행에 추가됩니다.
이제 어떻게해야 나는 생각할 수 없습니까?
도움이 될만한 도움이 될 것입니다.
어떻게 일반적으로 데이터를 가져오고 있습니다를 추출하기 위해 아래의 SELECT 문을 사용할 수 있습니까? 어떤 도구/프로그래밍 언어를 사용합니까? 오히려 간단한 정규식을 사용하면 아마 열 및 값 쌍을 필터링 할 수 있습니다. 이 쌍을 사용하면 쉽게 하이브로 가져올 수있는 CSV를 만드는 것이 어렵지 않습니다. – spijs
이 파일의 정규식을 만들고이를 CSV로 변환하는 방법은 무엇입니까? @spijs –