corpus

    5

    2답변

    텍스트 blob에서 이름을 필터링하려고합니다. 현재 단어 목록을 생성하고 손으로 필터링하고 있지만 ~ 8k 단어가 있으므로 더 나은 방법을 찾고 있습니다. 나는 사전을 붙잡고 그들을 걸러 낼 수 있었다. 그러나 그것은 스미스와 벼랑과 같은 이름을 추려 낼 것이다. 내가 필요하면 다음 중 하나입니다 : 일반적인 이름의 목록 또한 단어 될 일이 이름 목록 (I

    3

    3답변

    MySQL로 가져올 수있는 무료 다운로드 사전 (또는 코퍼스가 더 나은 단어 일 수 있음)을 찾으려고합니다. 나는 그들과 관련된 유형 (명사, 동사, 형용사)을 갖기 위해 단어가 필요합니다. 내가 어디에서 찾을 수 있는지에 대한 조언? 몇 년 전 그 중 하나가 멋지게 작동했으나 더 이상 사용하지 않았습니다. 감사합니다. Chris

    7

    2답변

    나는 내가 NLTK 설치 프로그램으로 설치 일부 말뭉치를로드하기 위해 노력하고있어하지만 난 가지고 : >>> from nltk.corpus import machado Traceback (most recent call last): File "<stdin>", line 1, in <module> ImportError: canno

    4

    4답변

    자동 텍스트 요약 자을 디자인 중입니다. 이 프로젝트의 주요 모듈 중 하나는 TRAINING CORPUS입니다. 누군가 트레이닝 코퍼스 또는 을 제공하여 나를 도울 수 있습니까?을 다운로드 할 링크가 있습니다. 고맙습니다.

    1

    3답변

    누구든지 Google이 인기있는 통과 블록 기능을 어떻게 만들었는지 이해하거나 알고 있거나 종합 문학 또는 소스 코드를 가르쳐 줄 수 있는지 궁금합니다. 그러나, 당신이 동일한 일을 할 수있는 다른 응용 프로그램을 알고 있다면 대답을 게시하십시오. 내가 가장 많이 쓰는 내용은 here is a link to an example입니다. 당신이 게오르기 N.