2016-11-08 3 views
-1

xml 형식의 데이터가있는 열이 포함 된 테이블이 있습니다. 내가 원하는 것은 해당 열의 데이터 일부를 파싱하는 것입니다. 표는 다음과 같습니다테이블 열 xml 형식의 데이터를 구문 분석하는 정규식 가져 오기

SalesID | SalesDetail 
--------|------------------ 
403958 | <SalesCode>4</SalesCode><SalesMessage>Same day shipping to customer in TX<SalesMessage> 
453324 | <SalesCode>4</SalesCode><SalesMessage>Customer complained issues at check-out <SalesMessage> 

사람 점 방향이 SalesCode 및 SalesMessage에 대한 데이터를 분석 할 임팔라 또는 하이브를 사용하는 수 있을까요?

여러 정규식을 시도했지만 원하는대로 작동하지 않습니다. 어떤 도움을 주시면 감사하겠습니다!

+0

당신이 원하는 예상되는 결과의 예를 들어 주실 수 있습니까? – Ibrahim

답변

0

당신은 xpath_stringxpath_int를 사용할 수 있습니다

SELECT xpath_int (SalesDetail, 'SalesCode') as SalesCode, 
     xpath_string (SalesDetail, 'SalesMessage') as SalesMessage FROM src; 
+0

Re-formatting 및 솔루션 팁에 대해 Alex에게 감사드립니다! – wusni

+0

@wusni 내 대답이 귀하의 질문을 해결했다면 그것을 수락하는 것을 고려하십시오 (녹색 체크 표시) –

+0

@alibov 제안과 함께 재 시도를했는데 이것은 분명 도움이되었지만 지금은 SalesCode SalesMessage가 빈 문자열을 반환하는 동안 모두 0입니다. 이견있는 사람? 고맙습니다! – wusni