2017-02-21 8 views
0

내가 질문 What is the ...? 랭커 ID없이 /fcselect 핸들러를 사용하여 물어 다음 문서있어 : 다음내 순위는 제대로 훈련 받았습니까?

"docs": [ 
    {"id": "100"}, // ranked first 
    {"id": "101"}, // ranked second 
    ... 
    {"id": "198"}, // ranked second from last (99th) 
    {"id": "199"} // ranked last (100th) 
] 

을, 나는 다음과 같은 지상의 진리를 사용하여 열하을 만들어 : 다음

What is the ...?,199,5,198,4 
... 

를, 내가 부탁 * 동일한 질문 */fcselect 랜카 처리기를 사용하여 다음 문서가 있습니다.

"docs": [ 
    {"id": "100"}, // ranked first 
    {"id": "101"}, // ranked second 
    ... 
    {"id": "199"}, // ranked 30th 
    ... 
    {"id": "198"} // ranked 35th 
    ... 
] 

그러나 나는 다음과 같은 순서로 같은 기대 :

"docs": [ 
    {"id": "199"}, // ranked first 
    {"id": "198"}, // ranked second 
    {"id": "100"}, // ranked third 
    {"id": "101"} // ranked 4th 
    ... 
] 

은 열하 제대로 훈련인가?

답변

3

비슷한 질문에 대한 답변은 여기를 참조하십시오. https://developer.ibm.com/answers/questions/317822/4-stars-answers.html.

학습 - 랭크 접근법을 사용하면 순위가 '정확함'으로 표시된 답변을 검색 결과의 맨 위까지 이동시킬 수 있습니다. 이는 랜카가 정답을 외우지 않고 이기 때문에 오히려 쿼리와 검색 결과 간의 겹침을 캡처하는 기능 값 분포에서 일반화를 포착하기를 원하기 때문입니다. 순위 조정자 훈련이 예상대로 작동하는지 확인하기 위해 대규모 쿼리 집합 (교육 중 사용 된 쿼리와 다른)에서 상위 1 개 결과 정확도를 측정하고 평균에 대해 의 개선 사항을 확인할 수 있습니다.

그렇다면 순위가 높은 상위 2 위 검색 결과가 순위 교육에 전혀 변경되지 않는다는 것은 분명 이상합니다. 실험을 통해 성능을 향상시킬 수있는 몇 가지 사항은 다음과 같습니다.