analyzer

0열

2답변

검색 엔진 (Java J2ee, Hibernate, Hibernate Search 및 Lucene)에서 작업하고 있습니다. 나는 문서 내용을 분석한다. 내 시스템은 모두 정상이지만 문제는 계속되고 있습니다. 분석기의 선택! 내 문서는 프랑스어로되어 있으며 연구가 프랑스어로되어있어 중요합니다. 그러나 내 검색 엔진은 (Java, COBOL, C, C#, C+

0열

2답변

단일 통신 식별

TCP로 설정된 통신을 식별하는 데 문제가 있습니다. 첫 번째 완료된 통신 (예 : 첫 번째 완전한 http 통신)을 식별해야합니다. 캡처 한 .pcap 파일을 덤프했습니다. 통신은 세 방향 핸드 셰이크 (SYN, SYN - ACK, ACK)로 시작한 다음 양측에서 이중 FIN 플래그로 통신을 종료해야 함을 알고 있습니다. 하지만 그 덤프 파일에는 많은 통

13열

1답변

탄성 검색 : 특정 색인에 사용 된 각 분석기를 나열하는 방법

특정 색인에 어떤 분석기 (유형, 언어 ..)가 구성되어 있는지 알아야합니다. http://localhost:9200/wazzup/_mapping을 시도했지만 필드 이름/유형에 대한 정보 만 제공합니다. , 당신은 그들이 어떻게 행동하는지보고 싶다면, 또한 curl -XGET 'http://localhost:9200/wazzup/_settings' an

0열

1답변

CUDA Visual Profiler를 실행하고 이해하는 방법?

저는 CUDA 5.0을 설치했고 CUDA 프로젝트가 잘 작동하지만 Visual Profiler로 CUDA 프로젝트를 분석하는 방법을 모르겠습니다. 그것을 실행하는 방법? 더 설치해야합니까? 어떻게해야합니까? 내 컴퓨터 사용 윈도우 7 64 비트, CUDA 5.0 64 비트, VS 2012

0열

1답변

Google 문서를 텍스트 문자열로 읽는 방법?

Google Apps 스크립트를 사용하여 간단한 텍스트 분석기를 만들려고합니다. 전체 Google 문서를 텍스트 문자열로 읽을 수 있기를 바랍니다. editAsText() 및 getDataAsBlob() 함수를 사용해 보았지만 문서 텍스트를 읽을 수있는 문자열 데이터로 반환하지 않는 것 같습니다. 누구나 Google Apps Script를 사용하여이를 수행

0열

1답변

ElasticSearch의 분석기가 작동하지 않습니다.

ElasticSearch를 사용하여 트위터 스트리밍 API에서받은 트윗을 저장하고 있습니다. 그것들을 저장하기 전에 트위터 내용에 영어 줄기를 적용하고 ElasticSearch 분석기를 사용하려고합니다. 이 내가 사용하고있는 현재 템플릿입니다 : 내가 스트리밍을 시작하고 인덱스가 생성되면 PUT _template/twitter { "templat

0열

1답변

맞춤형 토크 나이저에서 색인 생성이 충돌합니다

Google은 독점 엔진을 연결하는 Solr 플러그인을 구축하고 있습니다. 의도 된 사용은 표준 tokenizer를 대체합니다. 인덱스에 SOLR 관리자에서 테스트 문서 시도 : (Hybrid search and indexing: words and token metadata in Solr이 배경이다). id,title 12345,A test title

1열

1답변

다국어 탄성 검색 인덱스

여러 언어로 문서를 색인화하고 있습니다. 알고있는 한 _analyzer 매핑을 사용하여 문서 필드 중 하나에서 색인 타임에 각 문서에 사용할 분석기를 지정할 수 있습니다. 는 본질적으로 http://www.elasticsearch.org/guide/reference/mapping/analyzer-field.html , 프랑스 문서 동안은 언어 필드가 "프랑

6열

2답변

영국과 미국 영어를 Elasticsearch로 정규화하십시오.

Elasticsearch에서 영국과 미국 영어를 정규화하는 것이 가장 좋습니다. Synonym Token Filter을 사용하면 매우 긴 구성 파일이 필요합니다. 실제로 영국과 미국 영어에는 수천 가지의 철자가있는 단어가 있으며 실제로 포괄적 인 단어 목록을 찾는 것은 거의 불가능합니다. 여기에 list of almost 2.000 words가 있지만 아직

0열

1답변

Lucene QueryParser 분석기 불일치

나는 매우 단순한 분석기을 사용하여 슬래시 (/)를 공백으로 대체하려고합니다. QueryParser은 파싱하기 전에 슬래시로 문자열을 이스케이프 처리해야하므로 "\ /"을 단일 공백으로 바꾸는 분석기에 MappingCharFilter을 추가했습니다. @Override protected TokenStreamComponents createComponents(