다소 큰 (~ 200M 문서) documentdb를 Azure Search로 가져 오려고하는데 ~ 24 시간 후에 인덱서 시간이 초과되었습니다. 인덱서가 다시 시작되면 처음부터 다시 시작됩니다. 즉, 40M 이상의 문서를 검색 색인에 추가 할 수 없습니다. 데이터 소스는 다음과 같이 설정 highwater 표시가 : 작은 DB를 테스트 할 때documentdb를 Azure로 가져올 때 Indexer 시간 초과 처리
var source = new DataSource();
source.Name = DataSourceName;
source.Type = DataSourceType.DocumentDb;
source.Credentials = new DataSourceCredentials(myEnvDef.ConnectionString);
source.Container = new DataContainer(myEnvDef.CollectionName, QueryString);
source.DataChangeDetectionPolicy = new HighWaterMarkChangeDetectionPolicy("_ts");
serviceClient.DataSources.Create(source);
highwater 표시가 제대로 작동하려면 나타납니다.
인덱서가 이와 같이 실패 할 경우 하이 워터 마크를 존중해야하며 그렇지 않은 경우 어떻게 큰 데이터 세트를 인덱스 할 수 있습니까?
감사합니다. Eugene. 이런 종류의 방식으로 데이터를 분할하는 분명한 방법이 없으므로 여기에서 문제를 발견하면 업데이트를 계속 살펴볼 것입니다. –
안녕하세요 이안, 지연에 대해 유감스럽게 생각합니다. 저는 이것을보고 대답을 업데이트했습니다. 다른 질문이 있으시면 언제든지 Microsoft 도메인의 eugenesh에 문의하십시오. 감사! –