2012-05-06 9 views
2

를 사용하여 :계산의 정밀도와 루씬에서 리콜 내가 정밀도를 측정하고, 두 개의 파일이 원래 코드에서 주제 파일 을 기억하기 위해서 루씬 벤치 마크 사용 로거

QualityQuery qqs[] = qReader.readQueries(new BufferedReader(new FileReader(topicsFile))); 

및 qrelsFile :

Judge judge = new TrecJudge(new BufferedReader(new FileReader(qrelsFile))); 

이 두 파일은 내가 이해할 수있는 텍스트 파일입니다. 그러나 두 파일을 모두 채우려면 무엇이 필요한지, 필자가 수동으로 작성했는지 또는 필요한 정보로 채우는 코드가 있는지를 모릅니다.

내가

감사 루씬 프로그램에서이 정밀도와 리콜 측정에 도움이 필요

답변

1

TrecJudge http://lucene.apache.org/core/old_versioned_docs/versions/3_4_0/api/all/org/apache/lucene/benchmark/quality/trec/TrecJudge.html

에 대한 Javadoc를 준다 :

판사 주어진 문서가 주어진 관련이있는 경우 판단을위한 Trec 형식에 기초한 고품질 질의.

TREC (http://trec.nist.gov/)은 정보 검색을위한 대회를 제공하는 일련의 회의입니다.

당신은 당신 자신의 탐정 작업 중 일부를해야 할지도 모르겠지만 이것은 나에게 관심사이고 좀 더 많은 정보를 추가 할 수 있습니다.

  • 관심 분야 그것의
  • 주석 부분 불러되어야 하는지를 나타내는 관련 코퍼스를 제공 벤치마킹을위한

    일반적으로

    전략은 같은 것이 될 것입니다. 정보가 양수이고 음수가없는 번호가 두 세트 일 수 있습니다.

  • 은 두 부분으로 나뉩니다. 하나는 응용 프로그램을 학습하는 것이고 다른 하나는 그것을 검사하는 것입니다. (더 많은 정교한 방법이 필요합니다.)
  • 테스트 세트를 통해 평가 소프트웨어를 실행하십시오.

형식을 TREC 형식으로 입력해야합니다.

+0

고맙습니다. 이제 나에게 분명합니다. 하지만 700 개가 넘는 파일이있는 코퍼스가 있습니다. 그래서 내가 알기로, IR 시스템에 기반하여 각 쿼리에 대해 검색 결과와 관련이있는 파일 목록을 지정하고이 정보를 topicsFile 및 qrlis 파일에 기록해야합니다. ? 정말 도움을 주셔서 감사합니다. – Abreal