MongoDB에서 원시 JSON 스트림 (Twitter 또는 NYTimes를 통해)을 효율적으로 저장하여 나중에 Lucene 또는 Hadoop으로 데이터 (NYTimes 기사 또는 Tweets/사용자 이름)를 색인 할 수 있습니다. Mongo에 데이터를 저장하는 가장 현명한 방법은 무엇입니까? JSON을 파이프해야할까요? 아니면 더 좋은 점이 있습니까? 나는 mongodb 용으로 3 대의 복제본 세트를 가진 단일 기계만을 사용하고 있습니다.MongoDB에서 원시 JSON 스트림을 효율적으로 저장하고 쿼리하려면 어떻게해야합니까?
검색 쿼리를보다 효율적으로 최적화하기 위해 쿼리를 작성하거나 데이터를 저장하는 효율적인 방법이 있습니까?
이 예제는 PHP를 사용하지만 다음과 같이 유용 할 수 있습니다. http://learnmongo.com/posts/mongodb-php-twitter-part-1/ –