를 사용하여 문자열을 검색하는 방법은 2 가지 질문이 있습니다. 한 컴퓨터에서 hadoop 클러스터 컴퓨터로이 파일을 전송해야합니다. 나는 거기에 hadoop (또는 거기에 scp 명령이없는 것 같아요?) hadoop 컴퓨터에 파일을 전송하는 방법?하둡에서 컴퓨터간에 파일을 전송하고 돼지
또한 파일이 내 hadoop 클러스터에 있으면 특정 문자열이 포함 된 레코드를 검색하려고합니다 (예 : 'XYZTechnologies'). 어떻게하는 건 돼지 야? 일부 샘플 코드는 나에게 큰 기쁨을 줄 것입니다.
내가 Hadoop/Pig를 작업하는 것은 이번이 처음입니다. 그래서 그것이 "너무 기본적인"질문이라면 나를 용서해주십시오.
또한2012-03-18 04:12:55,655 [main] ERROR org.apache.pig.tools.grunt.Grunt - ERROR 1000: Error during parsing. Encountered " "(" "("" at line 3, column 26.
Was expecting:
<QUOTEDSTRING> ...
, 그래서, 내가 레코드에 아무 곳이나 문자열을 검색하려면 다음 사항을 유의하시기 바랍니다 :
EDIT 1
나는 Jagaran 제안 나는 다음과 같은 오류를 가지고 무엇을하려고 하나의 단일 열로 탭 구분 레코드를 읽습니다.
A = PigStorage ('\ n')를 사용하여 '/ user/abc/part-00000'로드 AS (Y : chararray);
복사를 HDFS로 : http://stackoverflow.com/q/1533330/179529 돼지는 의미하지 않습니다 검색. 많은 조작 데이터 (ETL)를 스캔하는 데 사용됩니다. – Guy