wordnet

    -4

    2답변

    두 synsets 사이의 연관성을 찾고 resnik, lin, wu palmer, 경로 알고리즘, leacock chodorow 등과 같은 많은 알고리즘을 보았습니다. 누가이 알고리즘 중에서 어느 것이 가장 효율적인지 말해 줄 수 있습니까?

    4

    2답변

    다음 두 세트가 있습니다. 아이디어는 내가 제공 한 몇 가지 메타 태그를 기반으로 뉴스 기사를 분류 할 수있게하는 것입니다. 예를 들어 나는 다음은 범죄 이야기로 분류해야한다 "판사" "5 년"을 가지고 기사를 얻을 때 train = [ ('Honda', 'cars'), ('Ford', 'cars'), ('Volkswa

    0

    1답변

    저는 특정 단어에 대해 유사한 (동의어) 단어를 찾는 "웹 비디오 분류"에 관한 마지막 해의 프로젝트를하고 있으며, 비슷한 용어를 제거하려고합니다. . 나는 자바 언어를 알고, 그래서 나는 "자바에 대한 말씀 유사성"난 단지 WS4J1.0.1 jar 파일을 사용하고이를 위해 ws4j , 심지어 내가 워드 넷 어휘 데이터베이스 나 같은 여분의 파일을 다운로드

    0

    1답변

    lucene 3에서는 wordnet의 색인 생성을 지원합니다. 하지만 lucene 4에서 보이지만, wordnet (wordnet_prolog \ wn_s.pl)을 어떻게 색인화 할 수 있습니까? 예를 들어 선생님은 lucene 4.5의 Syns2Index에 해당하는 것을 알고 있습니까? 감사

    2

    1답변

    주어진 임의의 단어 집합에서 단어의 중요성을 찾으려고합니다. 예를 들어, "사고"가 "남자, 여자, 사고"라는 단어에서 가장 중요한 단어라는 것을 알고 싶습니다. 순진한 해결책은 각 단어에 대해 WordNet 깊이를 얻고 단어 깊이의 차이에 따라 단어의 중요성을 계산하는 것이 었습니다. 이 솔루션은 최종 중요성을 생성하기 위해 n (n-1) 개의 계산이 필

    0

    1답변

    나는 polysemy disambiguation project에 대해 연구 중이다. 그리고 그것에 대해서 입력 쿼리로부터 polysemous words를 찾으려고한다. 내가하는 방법은 다음과 같습니다. #! /usr/bin/python from nltk.corpus import stopwords from nltk.corpus import wordnet

    4

    1답변

    WordNet2.0 풀세트를 다운로드했습니다. RDF/XML 문서 wnfull.rdfs에는 다음과 같은 요소가 있습니다 (예 : &wn20schema;AdverbSynset, URI가 예상되는 위치의 속성 값). 나는 #, url/ 및 value:이 일반적으로 사용되는 방법을 알고 있지만 이것은 &...; 표기법은 무엇입니까? <rdfs:Class rdf:

    -2

    1답변

    사실 내 문제는 문서에 단어가 포함 된 단어를 추출하여 문서에있는 단어 만 가져 오는 것입니다. 하지만 결과는 여전히 비어 있습니다. 왜냐하면 단어가 다른 형식이기 때문입니다. 문서의 단어를 기본 양식으로 변경하려면 어떻게해야합니까? 예를 들어 "car"라는 단어가 있고 wordnet을 통해 해당 하이퍼 단어가 발견되면 문서에서 찾은 단어를 어떻게 유지해야

    2

    1답변

    wordnet과 같은 열린 사전의 데이터베이스 크기를 거치고 있습니다. 52 MB은 데이터베이스 크기입니다. 하지만 Google Play에있는 오프라인 사전 응용 프로그램 중 일부는 위키 피 디아 데이터베이스를 사용하는 1 : English Dictionary app과 같습니다. 나는 그들이 오프라인 사전15 MB 크기와 167000 단어를 제공하는 것을

    0

    1답변

    NLTK를 시작하기 위해 매끄럽게 묶은 Python. 내 Windows 7 64 비트 시스템에서 파이썬을 설치 거친 시간 후, 지금 Wordnet는 다른 NLTK 데이터 패키지를 다운로드 힘든 시간을 보내고 있어요 것은 여기에 있습니다 : 일부 패키지 다운로드 http://nltk.org/nltk_data/ , 일부는 부족 "라고 날짜 " import nl