하둡 초자연적 인 내용입니다.이 자습서를 사용하여 https://acadgild.com/blog/streaming-twitter-data-using-flume/ 트윗을 캡처합니다. 그것은 트윗을 스트림Flume이 트위터 스트림에 대한 키워드를 허용하지 않습니다.
TwitterAgent.sources = Twitter
TwitterAgent.channels = MemChannel
TwitterAgent.sinks = HDFS
TwitterAgent.sources.Twitter.type = org.apache.flume.source.twitter.TwitterSource
TwitterAgent.sources.Twitter.consumerKey=xxxx
TwitterAgent.sources.Twitter.consumerSecret=xxxx
TwitterAgent.sources.Twitter.accessToken=xxxx
TwitterAgent.sources.Twitter.accessTokenSecret=xxxx
TwitterAgent.sources.Twitter.keywords= #canpoli
TwitterAgent.sinks.HDFS.channel=MemChannel
TwitterAgent.channels.MemChannel.capacity=10000
TwitterAgent.sinks.HDFS.type=hdfs
TwitterAgent.sinks.HDFS.hdfs.path=hdfs:/xxxx/user/flume/tweets
TwitterAgent.sinks.HDFS.hdfs.fileType=DataStream
TwitterAgent.sinks.HDFS.hdfs.writeformat=Text
TwitterAgent.sinks.HDFS.hdfs.batchSize=1000
TwitterAgent.sinks.HDFS.hdfs.rollSize=0
TwitterAgent.sinks.HDFS.hdfs.rollCount=10000
TwitterAgent.sinks.HDFS.hdfs.rollInterval=600
TwitterAgent.channels.MemChannel.type=memory
TwitterAgent.channels.MemChannel.capacity=10000
TwitterAgent.channels.MemChannel.transactionCapacity=1000
TwitterAgent.sources.Twitter.channels = MemChannel
TwitterAgent.sinks.HDFS.channel = MemChannel`
잘, 제대로 내 원하는 디렉토리에 저장하지만 내 키워드 필터링없이 모든 스트리밍 할 것 : 여기 내 flume.conf 파일입니다. 해시 태그가있는 경우를 제외하고 전 세계의 트윗을받습니다.
무슨 문제 일 수 있습니까?
내가 해시 태그를 제거에 배치 할 필요가 나는 같은 결과를 얻을. 가져 오는 모든 트윗에는 키워드가 하나도 포함되어 있지 않습니다. – JLA
제공된 예제를 실행하면 어떻게됩니까? –
똑같은 일이 발생합니다. – JLA