0
NLP 작업에 Gensim을 사용하고 있으며 현재 빈 문서가 포함 된 코퍼스가 있습니다. 이것이 옵션이긴하지만 내 코드를 다시 실행하고 싶지 않고 단지 내용이없는 문서를 제거하려고합니다. 문서는 이미 TF-IDF corpora로 저장되어 있으며 비어있는 이러한 문서를 제거 할 수있는 방법이 있는지 궁금해하고있었습니다. 나는 어떤 문서가 비어 있는지를 알아낼 수 있지만, 자료 파일은 반복자이며 어떤 유형의 자료 구조 (예 : 목록)가 아닙니다. 감사합니다,Gensim에서 문서 제거
카메론