2017-11-17 10 views
0

의 값 I는 이제 다음 유형핫 인코딩 큰 dataframe

id alphabet 
20 a 
20 b 
30 b 
30 c 

의 데이터 프레임을 복수의 비 - 고유 ID가있다. 비 고유 한 영문자도 여러 개 있습니다.
제가

따라서 행의 고유 ID에 기초하여 결합 된
id alphabet_a alphabet_b alphabet_c 
    20 1   1   0 
    30 0   1   1 

, 한 핫 인코딩 값 (알파벳)를 수행 한 다음과 같은 형식의 결과 싶다.
어떻게하면 대규모 데이터 프레임에서이 작업을 수행 할 수 있습니까?

+0

내가 위의 현재 데이터 프레임의 하나 뜨거운 인코딩을 할 경우, 내가 4 IDS 20,20,30,30와 데이터의 행과 적절한 열을 얻을 . 그렇다면 어떻게 id를 기반으로 둘 이상의 행을 병합 (또는 조인 또는 추가) 할 수 있습니까? – Akhil

답변

0

당신은 같은 dcast를 사용할 수있는이

library(reshape2) 

df <- read.table(text = "id alphabet 
      20 a 
      20 b 
      30 b 
      30 c", header = T) 

dcast(df, id~alphabet, fun = length) 

    id a b c 
1 20 1 1 0 
2 30 0 1 1 
+0

그것이 작동하는 것 같습니다!. 하드킨 감사합니다! – Akhil

+0

당신이 받아 들일 수 있고 upvote 귀하의 쿼리를 해결하면 대답 –

+0

완료!. 다시 한번 감사합니다 – Akhil