.NET 응용 프로그램에서 텍스트 마이닝, 사실 추출 및 의미 분석을 활용할 수있는 무료 도구/구성 요소/라이브러리를 찾고 있습니다. GATE 프로젝트가 필요하지만 Java로 작성되었습니다. .NET 세계에서 GATE와 같은 것이 있습니까? 내 challange는 웹 사이트 텍스트 콘텐츠에서 특정 사실을 추출하는 것입니다. 이러한 기능을 구현하기 위해 일부
PostgreSQL의 텍스트 열에서 n 그램을 만들려고합니다. 필자는 현재 텍스트 열의 데이터 (문장)를 배열에 분할합니다 (공백). 를 n-g를 찾기 위해 루프를 생성하고 : enter code here 선택 regexp_split_to_array TABLENAME에서 (sentenceData, E '\ s의 +')는 내가이 배열이 있으면, 어떻게 할 나
최근에 n-gram과 텍스트 본문의 구의 빈도를 비교할 수있는 멋진 가능성에 대해 알아 냈습니다. 지금은 단순히 텍스트 본문을 가져오고 가장 자주 사용되는 구 (n> = 2)의 목록을 반환하는 vb.net 응용 프로그램을 만들려고합니다. 텍스트 본문에서 n-gram을 생성하는 방법에 대한 C# 예제를 발견하여 코드를 VB로 변환하는 것으로 시작했습니다. 문
전 문서 모음 내에서 사전 기반 텍스트 검색과 관련된 작은 프로젝트를 진행하고 있습니다. 내 사전에는 긍정적 인 신호 단어 (일명 좋은 단어)가 있지만 문서 모음에서는 단어를 찾는 것만으로 긍정적 인 결과를 보장하지는 않습니다. 예를 들어 (중요하지 않지만) 이러한 긍정적 인 단어의 근처에있을 수있는 부정적인 단어가있을 수 있기 때문입니다 . 문서 번호,
저는 NLP (Natural Language processing)에 새로 들어설 수 있습니다. 프로젝트를 시작하기 위해 필자는 두 가지 유사한 문장을 인식 할 수있는 시스템을 개발 중입니다. Lexical, Syntax, Semantic의 세 가지 수준에서 다양한 측정을 적용 할 것입니다. 어휘 수준에서 코사인 유사성, 일치 계수, jaccard 계수 ..
이 문제를 해결하는 데 도움이 필요합니다. 지정된 도메인의 문서가 대량입니다. 이 문서는 다른 출처에서 가져온 것이므로 구조도 매우 다를 수 있습니다. 다른면에는 필자가 문서의 일부를 채워야하는 특정 필드가있는 테이블이 있습니다. 예를 들어 : 회사 X는 $ 1,000,000 회사 Y 올해의 교환했다 2010 년 $ 20mio의 비즈니스 볼륨을했다. 결과는
Python에서 액세스하고 싶은 Perl 라이브러리가 있습니다. 어떻게 사용할 수 있습니까? 참고로 소프트웨어는 NCleaner입니다. 나는 HTML 문자열을 텍스트로 변환하기 위해 파이썬에서 사용하고 싶습니다. (예, 아론 스 파이톤 html2text에 대해 알고 있습니다. 보일러 플레이트를 제거하기 때문에 NCleaner가 더 좋습니다.) Perl 프로
저는 특정 주제/아이디어가 텍스트 본문에서 언급 될 때이를 감지하는 것이 매우 유용한 순간에 프로젝트를 진행하고 있습니다. 예를 들어, 텍스트에 다음이 포함 된 경우 : 존스 씨가 누구인지에 대해 조금 더 말해 주면 도움이 될 것입니다. 외모에 대한 설명이 있거나 사진을 더 잘 표현할 수 있다면 유용 할 것입니다. 그 사람이 존스 씨의 사진을 요청했는지 감