0
데이터를 섭취 :전처리 및 우리는 로그의 두 가지 유형이 하둡
1) 세션 로그 : SESSION_ID, USER_ID, START_DATE_TIME, END_DATE_TIME
2) 이벤트 로그 : SESSION_ID, DATE_TIME, X, Y, Z
이벤트 로그를 저장하기 만하면되지만 SESSION_ID를 해당 USER_ID로 바꾸고 싶습니다. 어떤 기술 (예 : Flume?)을 사용하여 HDFS에 데이터를 저장해야합니까?
감사합니다.