nlp

    0

    1답변

    저는 tfidf와 같은 다양한 메트릭에서 interdocument 유사성 테스트를 수행하기 위해 50 개 문서의 코퍼스에 사용할 수있는 패키지 (실제로는 모든 언어)를 찾고 있습니다. okapi, 언어 모델, lsa 등 결과적으로 문서 유사성 행렬을 원합니다. 즉, doc1은 doc2와 비슷합니다. 이것은 연구 목적을위한 것이며 생산을위한 것이 아닙니다.

    20

    5답변

    나는 자바로 영어에 lemmatisation 구현을 찾고있다. 나는 이미 몇 가지를 발견했지만, 나는 많은 메모리 (1GB 상단)를 실행할 필요가없는 것을 필요로한다. 감사합니다. . 줄기 따위는 필요 없어.

    1

    2답변

    &을 구문 분석해야합니다. 반 구조화 된 텍스트 (기본적으로 법률 문서 - 법률 텍스트, 부록, 조약, 판사의 결정 등)를 처리해야합니다. 제가하고자하는 가장 근본적인 부분은 챕터, 기사, 부제목, 그리고 일부 메타 데이터를 포함하여 하위 부분이 어떻게 구성되어 있는지에 대한 정보를 추출하는 것입니다. 내 질문은이 유형의 텍스트 프로세싱에 대한 시작점을 가

    4

    3답변

    누군가가 정서 분석을 시작하는 방법에 대한 시작점을 줄 수 있습니까? 해당 작업에 사용할 수있는 오픈 소스 도구를 제공 할 수 있다면 좋을 것입니다. 현재 내가 GATE (http://gate.ac.uk)와 RapidMiner (http://rapid-i.com/)에서 찾고 있어요,하지만 난 갑자기 중간에 생각 나는 기초 이러한 도구를 시작하는 부족한 생각

    0

    1답변

    웹 서비스를 통해 Google Wave Context-Aware Spell Checker을 사용할 수 있습니까? 그렇다면 간단한 예제를 올릴만큼 친절하십니까?

    1

    1답변

    나는 자연어 처리 프로젝트에서 일하고있다. 그것은 아랍어를위한 도서관을 건설하는 것을 목표로한다. 우리는 POS 태거에 종사하고 지금 문법 단계에서 생각하고 있습니다. 아랍어와 다른 많은 사람들은 문법이 복잡하기 때문에 문맥 자유 문법 (CFG)을 만드는 것은 매우 어렵습니다. 이런 이유로 저는 감독되지 않은 학습을 사용하여 태거 코사에서 임의의 언어에 대

    4

    3답변

    저는 수만 명의 기사가있는 다소 큰 자료를 만들고 있습니다. 나는 현재 PDFBox를 사용하여 다양한 성공을 이끌어 내고 있으며, 추출이 적절하게 성공했는지 여부를 프로그램 적으로 각 파일에서 확인하는 방법을 찾고 있습니다. 나는 현재 각각에 대해 맞춤법 검사기를 사용하려고 생각하고 있지만 언어가 다를 수 있으므로 어떤 언어를 사용하고 있는지 확실하지 않습

    4

    10답변

    블로그 게시물을 쓸 수있는 웹 사이트를 운영하고 있으므로 서면으로 작성한 내용을 요약하여 예를 들어 <meta name="description".../> 태그를 채우기 위해 사용하고 싶습니다. 사용자 제작 콘텐츠의 콘텐츠를 자동 요약/설명하는 데 사용할 수있는 방법은 무엇입니까? 이 문제를 해결 한 방법 (선호 무료)이 있습니까? (내가 본 다른 웹 사이트

    1

    1답변

    icu::BreakIterator을 사용하여 특정 단어를 찾는 방법을 알고 싶습니다. 이 될 수 여부하려면 : 예를 들어 나는 다음과 같은 문장이 있습니까? 즉 말씀은 휴식 반복자의 인스턴스가 휴식을 둘 것입니다 ... 질문입니다 : |로 | |있을 | | 또는 | | 아닙니다 | |에 | | 될 | 그거 | |이다 | | | | 질문 |. |.... |

    1

    2답변

    구절에서 문장 구절을 어떻게 파싱합니까? 는이 구절 에서 예를 들어 코난 도일은 홈즈의 문자가 도일은 에딘버러 로얄 의무실에서 점원으로 일했다 누구를 위해 박사 조셉 벨, 영감을 얻었다 고 말했다. Holmes와 마찬가지로, Bell은 가장 작은 관찰 결과에서 큰 결론을 이끌어 냈습니다. [1] Michael Harrison은 Ellery Queen의 My