0
Solr Version: 6.3.0
Cloud: Yes
Shards: Single(1)
Data Size: 50GB
Records: 12M
주어진 컬렉션에서 관련 ID를 찾으려고하는 Solr Join 쿼리가 있습니다 (예 자체 조인). 이로 인해 성능이 저하되었습니다.Solr 파서 퍼포먼스 문제에 합류하십시오.
Solr은 언급 된 q 필터와 관계없이 from_field에서 모든 용어를 검색 한 다음 to_field 용어와 교차하려고 시도합니다. Join parser에서 to_field와 교차하기 전에 용어를 필터링하도록 solr에게 요청할 수있는 방법이 있습니까?
우리는 주어진 solr 필드에 대해 약 9M 용어를 사용합니다.이 필드는 성능 저하의 원인이라고 가정합니다.
"join": {
"{!join from=from_field to=to_field fromIndex=insight_pats_1_shard1_replica1}to_field: \u0001\u0000\u0000\u0000\u0000\u0000\u0003X\u0002H": {
"time": 16824,
"fromSetSize": 1,
"toSetSize": 0,
"fromTermCount": 8561723,
"fromTermTotalDf": 8561723,
"fromTermDirectCount": 8561505,
"fromTermHits": 0,
"fromTermHitsTotalDf": 0,
"toTermHits": 0,
"toTermHitsTotalDf": 0,
"toTermDirectCount": 0,
"smallSetsDeferred": 0,
"toSetDocsAdded": 0
}
},
"rawquerystring": "*:*",
"querystring": "*:*",
"parsedquery": "(+MatchAllDocsQuery(*:*))/no_coord",
"parsedquery_toString": "+*:*",
"explain": { },
"QParser": "ExtendedDismaxQParser",
"altquerystring": null,
"boost_queries": null,
"parsed_boost_queries": [ ],
"boostfuncs": null,
"filter_queries": [
"account_ids:1",
"{!join from=from_field to=to_field fromIndex=insight_pats_1}to_field:7733576"
],
"parsed_filter_queries": [
"account_ids:1",
"JoinQuery({!join from=from_field to=to_field fromIndex=insight_pats_1_shard1_replica1}to_field: \u0001\u0000\u0000\u0000\u0000\u0000\u0003X\u0002H)"
]