2017-10-22 5 views

답변

1

스파크 자체는 어떤 언어도 처리하거나 분석하지 않습니다. 여기에는 정서 분석과 같은 기본 NLP (자연 언어 처리) 기능이 없으므로 다른 라이브러리/프레임 워크를 사용해야합니다.

스파크 스트리밍을 사용하면 안정적인 분산 방식으로 문자열 집합을 수집 할 수 있습니다. UTF-8 (스파크와 트위터의 기본값 임)을 사용하는 한 트위터 메시지는 그대로 보존됩니다.

+0

감사합니다. 아랍어 트윗 분석을 위해 스파크에서 사용할 수있는 것에 대한 제안 사항이 있습니까? –

+0

정확히 달성하려는 것은 무엇입니까? 어떤 과제를 해결해야합니까? –

+0

감정 분석 –