analyzer

    0

    2답변

    검색 엔진 (Java J2ee, Hibernate, Hibernate Search 및 Lucene)에서 작업하고 있습니다. 나는 문서 내용을 분석한다. 내 시스템은 모두 정상이지만 문제는 계속되고 있습니다. 분석기의 선택! 내 문서는 프랑스어로되어 있으며 연구가 프랑스어로되어있어 중요합니다. 그러나 내 검색 엔진은 (Java, COBOL, C, C#, C+

    0

    2답변

    TCP로 설정된 통신을 식별하는 데 문제가 있습니다. 첫 번째 완료된 통신 (예 : 첫 번째 완전한 http 통신)을 식별해야합니다. 캡처 한 .pcap 파일을 덤프했습니다. 통신은 세 방향 핸드 셰이크 (SYN, SYN - ACK, ACK)로 시작한 다음 양측에서 이중 FIN 플래그로 통신을 종료해야 함을 알고 있습니다. 하지만 그 덤프 파일에는 많은 통

    13

    1답변

    특정 색인에 어떤 분석기 (유형, 언어 ..)가 구성되어 있는지 알아야합니다. http://localhost:9200/wazzup/_mapping을 시도했지만 필드 이름/유형에 대한 정보 만 제공합니다. , 당신은 그들이 어떻게 행동하는지보고 싶다면, 또한 curl -XGET 'http://localhost:9200/wazzup/_settings' an

    0

    1답변

    저는 CUDA 5.0을 설치했고 CUDA 프로젝트가 잘 작동하지만 Visual Profiler로 CUDA 프로젝트를 분석하는 방법을 모르겠습니다. 그것을 실행하는 방법? 더 설치해야합니까? 어떻게해야합니까? 내 컴퓨터 사용 윈도우 7 64 비트, CUDA 5.0 64 비트, VS 2012

    0

    1답변

    Google Apps 스크립트를 사용하여 간단한 텍스트 분석기를 만들려고합니다. 전체 Google 문서를 텍스트 문자열로 읽을 수 있기를 바랍니다. editAsText() 및 getDataAsBlob() 함수를 사용해 보았지만 문서 텍스트를 읽을 수있는 문자열 데이터로 반환하지 않는 것 같습니다. 누구나 Google Apps Script를 사용하여이를 수행

    0

    1답변

    ElasticSearch를 사용하여 트위터 스트리밍 API에서받은 트윗을 저장하고 있습니다. 그것들을 저장하기 전에 트위터 내용에 영어 줄기를 적용하고 ElasticSearch 분석기를 사용하려고합니다. 이 내가 사용하고있는 현재 템플릿입니다 : 내가 스트리밍을 시작하고 인덱스가 생성되면 PUT _template/twitter { "templat

    0

    1답변

    Google은 독점 엔진을 연결하는 Solr 플러그인을 구축하고 있습니다. 의도 된 사용은 표준 tokenizer를 대체합니다. 인덱스에 SOLR 관리자에서 테스트 문서 시도 : (Hybrid search and indexing: words and token metadata in Solr이 배경이다). id,title 12345,A test title

    1

    1답변

    여러 언어로 문서를 색인화하고 있습니다. 알고있는 한 _analyzer 매핑을 사용하여 문서 필드 중 하나에서 색인 타임에 각 문서에 사용할 분석기를 지정할 수 있습니다. 는 본질적으로 http://www.elasticsearch.org/guide/reference/mapping/analyzer-field.html , 프랑스 문서 동안은 언어 필드가 "프랑

    6

    2답변

    Elasticsearch에서 영국과 미국 영어를 정규화하는 것이 가장 좋습니다. Synonym Token Filter을 사용하면 매우 긴 구성 파일이 필요합니다. 실제로 영국과 미국 영어에는 수천 가지의 철자가있는 단어가 있으며 실제로 포괄적 인 단어 목록을 찾는 것은 거의 불가능합니다. 여기에 list of almost 2.000 words가 있지만 아직

    0

    1답변

    나는 매우 단순한 분석기을 사용하여 슬래시 (/)를 공백으로 대체하려고합니다. QueryParser은 파싱하기 전에 슬래시로 문자열을 이스케이프 처리해야하므로 "\ /"을 단일 공백으로 바꾸는 분석기에 MappingCharFilter을 추가했습니다. @Override protected TokenStreamComponents createComponents(