2013-03-29 5 views
0

나는 자유 텍스트의 백만 레코드가있는 컬렉션으로 mongodb를 가지고 있습니다. 이 텍스트에 온라인 질의를 사용하고 싶습니다. 내가 사용하는 사이에 고려되었다 : 키워드 검색에 대한mongodb2.4 신축성있는 검색 및 자유 텍스트 검색

  1. 모델 데이터 http://docs.mongodb.org/manual/tutorial/model-data-for-keyword-search/
  2. MongoDB를 2.4의 새로운 무료 텍스트 검색 엔진
  3. 탄성 검색

첫 번째 질문 : 탄성 검색을 사용하는 경우 사실 탄성 검색이 모든 문서를 보관하므로 더 이상 mongodb가 필요하지 않습니다. 내가 맞습니까?

두 번째 질문/문제 : 문서에있는 텍스트의 언어가 다를 수 있습니다. 모든 컬렉션의 언어를 지정해야하는 mongo2.4의 제한 사항 인 것 같습니다. 내가 맞습니까? 그래서 솔루션 1 (모델 데이터)을 사용하거나 먼저 언어에 따라 텍스트를 구분해야합니다. 권리? http://docs.mongodb.org/manual/tutorial/create-text-index-on-multi-language-collection/ 그래서 난 그냥 특정 분야 내에서 문서의 언어를 지정해야합니다 의견

덕분에, 제안 콜린

+0

볼 수 있었다 그것이 당신의 불특정 요구 사항을 충족시키는 지에 관한 질문. MongoDb 텍스트 검색은 프로덕션 사용을 위해 준비되지 않았습니다. 그것은 실험적으로 분류됩니다. – WiredPrairie

답변

0

OK, 나는 어쩌면 다국어 문제에 대한 해결책을 발견했다.

mongo rocks !! 의견이나 비고는 무엇입니까?

+0

당신에게 좋은 대답을주기가 정말 어렵습니다. 검색 요구 사항이 무엇인지 정확하게 검색 할 필요는 없지만 정확하게 검색해야합니다. 당신은 기본적인 검색 요구 사항을 가지고 있으면 mongo가 적합 할지도 모르겠지만, elasticsearch는 훨씬 더 유연성이 있으며, 그 목적과 성능을 위해 정확하게 만들어진 것 같습니다. 다른 한편으로는 mongo 전체 텍스트 검색 기능이 아직 입증되지 않은 것 같아서 NoSQL로 elasticsearch를 사용할 수 있다고 알려져 있습니다. – javanna

+0

예 mongo의 전체 텍스트 검색은 아직 입증되지 않았습니다. 그러나 mongo와 탄성 검색을 모두 사용하여 저장된 정보를 복제하는 것은 과도한 것으로 보입니다. 당신이 신축성있는 검색을하는 것처럼 보입니다. 간단한 질문 : 간단한 방식으로 가장 반복되는 단어의 목록을 가져 오는 것이 가능합니까 (지금까지는 텍스트를 집계 한 다음 collection.Counter 클래스를 사용하여 파이썬으로 작성했습니다) – colin

0

작성한 앱이 무엇입니까?

ElasticSearch C# NEST client driver이 재미 있거나 사용하기 쉽지 않아서 우리가 ElasticSearch 클러스터를 설정할 때 ElasticSearch 문서가 좋지 않았기 때문에.

원한다면 EC2에 ElasticSearch를 설정하는 절차가 있습니까?

집계 쿼리와 캐시가 빠르고 정확하며 설정이 쉽기 때문에 MongoDB을 사용합니다.

새로운 MongoDB Free Text Search 기능은 흥미롭고 가치가 있지만 사용 사례에 따라 다릅니다.

당신은 자세한 내용을보실 수 있습니다 당신이 Amazon Web Services를 사용하는 경우, 호스팅하는 곳에 따라

또한 내 블로그 게시물에 MongoDB Free Text Search에 대한 코드 예제를 참조하십시오 당신은 당신이 처음에 대답 할 수 CloudSearch