Google은 GMail 위에 앉아서받은 편지함을 색인하려고하며 App Engine 검색 API를 사용하고 있지만 10GB 한도를 치고 있습니다. 우리가 전체 팀의받은 편지함 전체를 검색 할 수 있도록 전체 조직의 전자 메일을 인덱싱하기 때문입니다. 어떻게이 문제를 해결할 수 있습니까? 한 가지 방법은 한 사람당 개별 색인을 갖고 어떻게 든 수동으로 결과를 결합하는 것이지만 병합 결과가 실제로 복잡 할 수도 있다고 걱정합니다! 어떤 옵션을 사용할 수 있는지 궁금하십니까?Google App Engine에서 10GB 제한을 해결하려면 어떻게해야합니까?
1
A
답변
0
파일 기능 요청 :
이 너무이 제기되었다https://code.google.com/p/googleappengine/wiki/FilingIssues?tm=3
그래서 어쩌면 스타 : https://code.google.com/p/googleappengine/issues/detail?id=10667
2
을이 어떤 문서 검색 시스템의 일반적인 문제이며, 솔루션이 슬라이스입니다 전체 자료를 여러 개의 버킷으로 요구 사항/사용 패턴에 따라 슬라이싱 전략을 선택해야합니다.
하나의 가능성은 날짜별로 메시지를 조각내는 것입니다. 제한에 가까워 질 때까지 인덱스에 메시지를 계속 추가합니다.이 시점에서 새로운 메시지에 대한 새 인덱스가 시작됩니다. 또는 달력 간격 (연간에 따라, 분기별로 또는 월별, 볼륨에 따라)을 수행 할 수 있습니다.
여러 색인의 결과를 병합하는 것은 간단합니다. 또한 사용자가 검색에 얼마나 오래 걸릴지 선택할 수있는 기회를 제공 할 수 있습니다. 종종 사람들은 최근에 일어난 일이나 오랜 전에 일어난 일을 찾고 있다는 것을 알고 있습니다.
각 결과 세트마다 고유 한 관련성 기준이 있으므로 병합이 매우 복잡하지 않은 경우 이러한 결과를 병합하면 각 결과가 얼마나 관련성이 있는지 평가해야합니다 (응용 프로그램)? 예. index1의 result3이 index2의 result2와 관련성이 높거나 그 반대의 경우가 발생할 수 있습니다. –
검색 API는 "관련성"을 계산하지 않습니다 - 쿼리와 "일치하는"결과 만 반환합니다. 사용자가 제공 한 키워드 및/또는 문구 조합과 관련하여 관련성을 평가하려면 모든 결과를 병합하고 관련성을 계산하는 데 사용하는 기준에 따라 각 결과를 분석해야합니다. 대부분의 이메일 클라이언트는 "관련성"을 전혀 사용하지 않으므로 사용자는 일반적으로 관련성에 따라 문서의 순위를 매기 길 기대하지 않습니다. 받은 편지함을 검색 할 때 결과는 날짜별로 정렬됩니다. –
정말 고맙습니다. –