whoosh

    1

    1답변

    DOC, DOCX, HTML 및 PDF 문서를 검색 할 때 Lucene/Solr, Whoosh, Sphinx 및 Xapian을 비교합니다. Solr만이 문서를 직접 색인화하는 문서 파서 (Tika)를 갖도록 문서화되었습니다. 그래서 그것은 명백한 승자로 보인다. 그러나 경기장을 평평하게하기 위해 나는 대안을 고려하기를 좋아합니다. 다른 사람이 직접 문서 색

    5

    1답변

    퍼즐이 있습니다. 내 건초 더미 + whoosh가 잘 작동합니다. f.e.을 통해 검색 할 수 있습니다. 내용의 이름. 하지만 핵심 모델에 "taggit"을 추가하고 태그를 통해 검색하려면 결과가 없습니다. // 이유를 모르겠습니다. 더 정확하게 나는 콘텐츠 이름 "X"에 "foo"라는 태그가 있고 "foo"를 통해 검색 할 때 결과가 없음을 알고 있습니다

    4

    2답변

    누구도 Whoosh 색인에 새 문서를 추가 할 때 이상한 오류가 발생하는 것을 도와 줄 수 있습니까? def add_to_index(self, doc): ix = index.open_dir(self.index_dir) writer = AsyncWriter(ix) # use async writer to prevent write lock er

    3

    1답변

    파이썬을 사용하여 문서 검색을 만들고 싶습니다. Solr은 Java 호스팅이 제약 조건 이었기 때문에 아무런 의미가 없었습니다. 그래서 whoosh는 명백한 옵션입니다. 그러나 doc 또는 pdf 파일을 기본적으로 색인 화하는 것은 아닙니다 (Solr이 할 수있는 것처럼). 이러한 파일을 직접 색인 생성하는 방법은 무엇입니까?

    3

    1답변

    Solosh의 Whoosh에서 내 검색 앱을 다시 실행하고 있습니다. 나는 지금 빠른 시작에서 배우고있다. 하지만 문제가 내가 문자열 >>>writer.add_document(iden=fil, content=F2T.file_to_text(fil_path)) ValueError: 'File Name.doc' is not unicode or sequence 다

    7

    1답변

    부분 검색어를 검색 할 수있는 문서 검색 엔진 (예 : Xapian, Whoosh, Lucene, Solr, Sphinx 또는 기타)을 찾고 있습니다. 예를 들어 검색 엔진은 "브리트니"또는 "영국"또는 일반적으로 단어 매칭 R *brit* 접선가 포함 된 문서 중 하나를 포함하는 문서를 반환해야 용어 "브릿"검색, 나는 대부분의 엔진을 발견 TF-IDF

    3

    2답변

    Whoosh 색인이 있어야하는 파일 시스템의 위치에 HAYSTACK_WHOOSH_PATH를 설정해야합니다. 누구나 정확히이 경로가 가리키는 위치를 설명 할 수 있습니까? 나는이 길에서 무엇을 주어야 하는가?

    0

    1답변

    당신이 나와있는 기술 할 필요가 어쨌든 질문에 대답하려고 원하는만큼 익숙하지 않은 경우, 여기에 몇 가지 유용한 링크입니다 : https://github.com/tallstreet/Whoosh-AppEngine http://code.google.com/appengine/docs/whatisgoogleappengine.html http://packages.p

    0

    1답변

    일부 포럼 앱을 설치하려고합니다. 아무것도 할 일이 없습니다. djangobb 포럼 및 The 'whoosh' backend requires the installation of 'Whoosh'. Please refer to the documentation. 은 건초 더미뿐만 아니라 붕 seperatley를 다운로드 setup.py 설치 파이썬을 통해 그

    5

    1답변

    whoosh을 사용하여 appengine에서 내 blogapp에 검색 기능을 추가하려고했지만 일부 정보를 이해하지 못합니다. 블로그 항목은 title, content 및 status 개의 필드로 인덱싱됩니다. 공용 페이지에서 다른 유형의 결과를 얻으려는 경우 관리 페이지에서 여러 개의 인덱스가 필요하지 않습니다. 에서 FrontPage에 나는 방문자 만 t