2017-12-06 25 views
-1

이제 Posexplode 함수를 사용하여 하이브에서 완료된 SQL Server에서 프로세스를 만들려고합니다.하이브의 Posexplode와 유사한 SQL Server 기능?

userid sku qty 
1 abc 2427022 3 
2 abc 1883575 1 
3 abc 2427022 3 
4 def 2427022 1 
5 def 1562336 1 
6 def 153842 1 
7 ghi 2427022 3 

감사 : 내가 같이 할 데이터를 원하는

userid  sku       qty 
1 abc  2427022      3 
2 abc  1883575|2427022    1|3 
3 def  2427022|1562336|153842  1|1|1 
4 ghi  2427022      3 

:

나는처럼 보이는 큰 데이터 세트를!

+1

https://stackoverflow.com/questions/5493510/turning-a-comma-separated-string-into-individual-rows – axawire

+1

는 SO 튜토리얼 사이트 또는 작업을 할 PPL의 풀 없습니다. 그 대신 문제를 해결하려고 시도한 코드로 특정 질문을하십시오. https://stackoverflow.com/help/how-to-ask –

+0

링크 외에도 선택 항목에 row_number()를 추가해야 할 수도 있으므로 sku 및 qty의 올바른 값을 결합 할 수 있습니다 같은 행에 속하는 필드 – axawire

답변

1

알아 냈습니다. 다른 사람이 두 구분 된 열을 구분하는 비슷한 문제가있는 경우 아래 코드를 사용하여 원하는 출력을 얻었습니다. SQL Server에서 Cross Apply 함수와 XML을 사용하여 Hive에서 posexplode 함수를 사용하는 것과 동일한 출력을 얻었습니다.

--Create test table 
create table Table1 (userid varchar(max), Sku varchar(max), Qty varchar(max)) 
insert Table1 select 'abc', '2427022' , '3' 
insert Table1 select 'abc', '1883575|2427022', '1|3' 
insert Table1 select 'def', '2427022|1562336|153842' , '1|1|1' 
insert Table1 select 'ghi', '2427022' , ' 3' 


;WITH CTE1 
AS 
(
    SELECT RN= Row_Number() over(Order by userid),userid, 
    Split.a.value('.', 'VARCHAR(100)') AS Sku 
FROM 
(
    SELECT Userid,Sku, 
     CAST ('<M>' + REPLACE(sku, '|', '</M><M>') + '</M>' AS XML) AS Data 
    FROM Table1 
) AS A CROSS APPLY Data.nodes ('/M') AS Split(a) 
) 
,CTE2 
AS 
(
    SELECT RN= Row_Number() over(Order by userid),userid, 
    Split.b.value('.', 'VARCHAR(100)') AS qty 
FROM 
(
    SELECT Userid,qty, 
     CAST ('<M>' + REPLACE(qty, '|', '</M><M>') + '</M>' AS XML) AS Data 
    FROM Table1 
) AS B CROSS APPLY Data.nodes ('/M') AS Split(b) 
) 
Select c.userid, c.Sku, d.qty 
from CTE1 as c 
Inner Join CTE2 as d 
on c.RN =d.RN