나는 문제가 생겨서 내가 성취하려고하는 것을 요약 할 것이므로 분명히 나를 안내 할 수있다.nltk python을 사용하여 movie_review와 비슷한 코퍼스를 만드는 방법 3.4
내가 코퍼스에게 movie_reviews 유사한 뭔가를 만들 movie_review 만 2 개 범주를했지만,내 경우처럼 여러 개의 범주와 하위 범주이 곳. 예컨대
:
는 제가 는 'A', 'B', 'C', 'D'및 'E'와 같은 카테고리를 만들고자하는 my_corpus 등의 코퍼스를 말한다. 이 카테고리에는 'A'와 같은 하위 카테고리가 포함됩니다. 하위 카테고리는 'a1', 'a2', 'a3'등과 같이 다른 모든 카테고리에 대해서도 마찬가지입니다. (B, C, D 및 E). 이 하위 카테고리는 각각 에 다시 'a1'과 같이 'a1.1', 'a1.2' 등의 하위 카테고리가 있습니다. 마지막으로 가장 아래쪽 (리프) 은 텍스트 해당 범주 또는 하위 범주와 관련된 파일.
내 질문에 내가 그렇게 어쨌든이 같은 신체를 만들 수 있습니다 방법>
1, 내가 응답 큰 도움이 될 것입니다, 당신은 또한 링크에 저를 매핑 할 수 있습니다 안내하시기 바랍니다있는 내가 할하는 데 도움이 될 수 있습니다이
2> 나는 naivebayes가 너 한테 나 실행할 수있는 다른 너 한테뿐만 아니라 내 경우에는 여기에, movie_reviews의 NEG와 POS를 찾기 위해 같은이 경우에 제품군 I 새로 질문 한 질문을 찾아야 할 때 카테고리와 하위 카테고리 등이 관련되어 있습니까?
친절히 도와주세요.
동일한 방식으로 구성하면 코드를 수정할 수 있습니다. 데이터는 어떻게 생겼습니까? –
내 데이터는 텍스트 파일입니다 ... 왜냐하면 내가 노드처럼 사용하고 싶기 때문에 카테고리와 하위 카테고리가 필요합니다. 일부 작업에 대해 리프 구조 등을 사용합니다. –
당신의 질문이지만, 저는 그것이 코퍼스 리더를 정의하는 것과 관련이 없다고 확신합니다. 즉, 별도의 질문입니다. – alexis