이 파일에는 Hadoop에있는 데이터 목록이 들어 있습니다. 나는 ID 번호하여 파일을 분석하는 간단한 돼지 스크립트를 구축했습니다, 등등 ...Hadoop Pig로 여러 출력 생성
는내가 찾고 마지막 단계는 이것이다 : 내가 만들 싶습니다 (저장) 각 고유 한 파일 id 번호. 그래서 이것은 그룹 단계에 달려 있습니다 ... 그러나 이것이 가능한지 이해하지 못했습니다 (아마도 맞춤 상점 모듈이 있을까요?).
아이디어가 있으십니까? 이 STORE
어떻게 작동하는지 당신이 변수에 데이터를 할당 할 필요가 출력 (파일 또는 무엇이든)을 얻기를위한
감사 다니엘