text-mining

6열

1답변

.NET 응용 프로그램에서 텍스트 마이닝, 사실 추출 및 의미 분석을 활용할 수있는 무료 도구/구성 요소/라이브러리를 찾고 있습니다. GATE 프로젝트가 필요하지만 Java로 작성되었습니다. .NET 세계에서 GATE와 같은 것이 있습니까? 내 challange는 웹 사이트 텍스트 콘텐츠에서 특정 사실을 추출하는 것입니다. 이러한 기능을 구현하기 위해 일부

3열

1답변

PostgreSQL의 텍스트에서 n 그램

PostgreSQL의 텍스트 열에서 n 그램을 만들려고합니다. 필자는 현재 텍스트 열의 데이터 (문장)를 배열에 분할합니다 (공백). 를 n-g를 찾기 위해 루프를 생성하고 : enter code here 선택 regexp_split_to_array TABLENAME에서 (sentenceData, E '\ s의 +')는 내가이 배열이 있으면, 어떻게 할 나

2열

2답변

vb.net에서의 N-gram 함수 -> 문자 대신 단어에 대한 그램 생성

최근에 n-gram과 텍스트 본문의 구의 빈도를 비교할 수있는 멋진 가능성에 대해 알아 냈습니다. 지금은 단순히 텍스트 본문을 가져오고 가장 자주 사용되는 구 (n> = 2)의 목록을 반환하는 vb.net 응용 프로그램을 만들려고합니다. 텍스트 본문에서 n-gram을 생성하는 방법에 대한 C# 예제를 발견하여 코드를 VB로 변환하는 것으로 시작했습니다. 문

0열

5답변

텍스트 마이닝 라이브러리 또는 언어 라이브러리?

나는 자신이 소유 한 포럼에서 수확 된 많은 데이터를 가지고 있으며 유용한 텍스트 정보를 추출하기 위해 일부 텍스트 마이닝 또는 일부 언어 라이브러리를 사용하고자합니다. 모든 텍스트 마이닝, 모든 언어의 데이터 마이닝 라이브러리가 수행합니다. 감사합니다.

3열

2답변

Word Proximity의 트랙 유지

전 문서 모음 내에서 사전 기반 텍스트 검색과 관련된 작은 프로젝트를 진행하고 있습니다. 내 사전에는 긍정적 인 신호 단어 (일명 좋은 단어)가 있지만 문서 모음에서는 단어를 찾는 것만으로 긍정적 인 결과를 보장하지는 않습니다. 예를 들어 (중요하지 않지만) 이러한 긍정적 인 단어의 근처에있을 수있는 부정적인 단어가있을 수 있기 때문입니다 . 문서 번호,

3열

2답변

문장 수준의 유사성을 이용한 의역 인식

저는 NLP (Natural Language processing)에 새로 들어설 수 있습니다. 프로젝트를 시작하기 위해 필자는 두 가지 유사한 문장을 인식 할 수있는 시스템을 개발 중입니다. Lexical, Syntax, Semantic의 세 가지 수준에서 다양한 측정을 적용 할 것입니다. 어휘 수준에서 코사인 유사성, 일치 계수, jaccard 계수 ..

2열

1답변

다른 구조화되지 않은 텍스트 파일 - 텍스트 마이닝에서 정보 검색

이 문제를 해결하는 데 도움이 필요합니다. 지정된 도메인의 문서가 대량입니다. 이 문서는 다른 출처에서 가져온 것이므로 구조도 매우 다를 수 있습니다. 다른면에는 필자가 문서의 일부를 채워야하는 특정 필드가있는 테이블이 있습니다. 예를 들어 : 회사 X는 $ 1,000,000 회사 Y 올해의 교환했다 2010 년 $ 20mio의 비즈니스 볼륨을했다. 결과는

6열

1답변

Python 내 Perl?

Python에서 액세스하고 싶은 Perl 라이브러리가 있습니다. 어떻게 사용할 수 있습니까? 참고로 소프트웨어는 NCleaner입니다. 나는 HTML 문자열을 텍스트로 변환하기 위해 파이썬에서 사용하고 싶습니다. (예, 아론 스 파이톤 html2text에 대해 알고 있습니다. 보일러 플레이트를 제거하기 때문에 NCleaner가 더 좋습니다.) Perl 프로

9열

3답변

주어진 텍스트에서 아이디어와 개념을 식별하는 방법

저는 특정 주제/아이디어가 텍스트 본문에서 언급 될 때이를 감지하는 것이 매우 유용한 순간에 프로젝트를 진행하고 있습니다. 예를 들어, 텍스트에 다음이 포함 된 경우 : 존스 씨가 누구인지에 대해 조금 더 말해 주면 도움이 될 것입니다. 외모에 대한 설명이 있거나 사진을 더 잘 표현할 수 있다면 유용 할 것입니다. 그 사람이 존스 씨의 사진을 요청했는지 감

5열

2답변

텍스트 - 광산 PDF 파일과 파이썬?

파이썬을위한 패키지/라이브러리가 있습니까? 그러면 PDF를 열고 특정 단어를 검색 할 수 있습니까?