pylucene

    1

    2답변

    토큰 화/색인 생성 용어 (Lucene에서) 또는 해당 검색에 대한 검색 엔진을 처리하는 가장 좋은 방법은 무엇인지 궁금합니다. "12"= "열둘" "MX1"= "MX 하나" 는 모든 I 내장 기능이 간과 한 있나요?

    3

    2답변

    나는 pylucene에 주문 분석기를 쓰고 싶다. 보통 Java 루씬에서는 분석기 클래스를 작성할 때 클래스가 lucene의 Analyzer 클래스를 상속합니다. 하지만 pylucene은 java to C++/python 컴파일러 인 jcc를 사용합니다. 그래서 파이썬 클래스가 jcc를 사용하여 자바 클래스를 상속하도록하려면 어떻게해야합니까? 특히 사용자

    0

    1답변

    lucene과 apache에 관한 이상한 문제가 있습니다. 나는 전체 텍스트 검색을 위해 내가 호출 할 필요가 검색에 대한 루씬을 사용하고 있습니다 : initVM() 나는 발견이 호출이 아무것도 실행되지 도착 후 그. 이 모든 것은 아파치를 통해 처리되는 http 요청에 대해 발생합니다. 이제 수동으로 대화 형 명령 프롬프트에서이 작업을 시도하면 정상적으

    0

    2답변

    나는 수많은 예제로 구성된 데이터 세트를 가지고 있는데, 각 예제에는 이름으로 분류 된 128 개의 연속 값 기능이 들어 있습니다. 나는 고차원 데이터를위한 KNN 분류 자로 사용할 큰 견고한 데이터베이스/인덱스를 찾고자합니다. 나는 Weka's IBk classifier을 시도했지만 많은 양의 데이터를 질식시키고 심지어 메모리에로드해야합니다. Lucene

    1

    1답변

    lucene 색인에서 Document 안에 Field에 사용 된 토큰 (토큰 목록, TokenStream 또는 다른 것이 든)을 어떻게 얻을 수 있습니까? 즉, 인덱스에서 tokens (예제)에 사용 된 토큰을 가져올 수 있습니까? 문서에서 doc.add(new Field("title", tokens)) 을 (내가 TokenStream에서 토큰을 얻는

    4

    1답변

    저는 Lucene으로 정보 검색을해야하는 프로젝트를 진행하고 있습니다. 파이썬으로 코딩하고 자바에 익숙하지 않다. 데이터 세트에는 4000 개의 문서가 있습니다. 이걸 살펴본 후 Lucene 또는 Pylucene과 함께 자이 썬을 사용할 수있는 것 같습니다. 프로젝트의 마감은 1 개월입니다. 나는 전에 자이 썬을 설치하지 않았다. Jython 또는 Pylu

    0

    1답변

    Windows XP에 pylucene을 설치하려고합니다. C : \ Program \ Java \ jdk1.6.0_18에 JDK를 설치했습니다. Visual Studio C++ Express를 설치하여 C++ 컴파일러도 설치했습니다. 첫 번째 단계로 는 내가 명령을 통해 python2.6에 JCC을 통합하기 위해 노력하고있어 : C : C:\Installf

    0

    1답변

    마지막으로 필자는 windows7 컴퓨터에서 작동하는 pylucene을 얻었습니다. 더 일반적인 질문이 있습니다. 어떻게하면 디렉토리에있는 dll을 가지고 있을까요? 경로, 파이썬 찾지 못했습니다, 그리고 내가 dll을 c : \ windows \ system32에 넣을 때 - 작동 했습니까? 사용하여 윈도우 7 32 비트

    1

    2답변

    PyLucene을 사용하려고하는데 현재 버전에서 실제로 실행되는 코드 예제를 찾을 수 없습니다. (예 : http://nullege.com/codes/search/PyLucene.StandardAnalyzer 참조). 어느 시점에서 분석기를 인스턴스화해야합니다. lucene.StandardAnalyzer()를 호출하여 수행해야하는 것으로 보입니다. 그러나,

    1

    1답변

    Python 시퀀스에서 TokenStream을 빌드하려고합니다. 그냥 재미를 위해 나는 ...에 의해 terms = ['pant', 'on', 'ground', 'look', 'like', 'fool'] stream = pylucene.PythonTokenStream() for t in terms: stream.addAttribute(pyluc