information-retrieval

    1

    1답변

    Indri 쿼리 언어를 사용하여 다음 부울 쿼리를 작성할 수 없습니다. 다음과 같이 작성해야하는 쿼리는 다음과 같습니다. (Stana or Katic) AND (Jon or Huertas) AND (co-stars or colleagues) 위의 내용이 포함 된 모든 문서의 목록이 필요합니다. 어떻게이 일을 할 수 있습니까?

    1

    1답변

    Solr 6.5.1에서 *_txt_en 필드와 string 문서 유형 필드가 있습니다. 이 필드에, 나는 형태의 쿼리 구축하고 싶습니다 : 일치를 특정 문서 유형의 모든 문서 여기서 특정 문구 ("문구 하나", "문장이") 일치 할 텍스트 필드에 있어야합니다. 그러나이 필드에는 다른 구문 ("phrase three", "phrase four", "phras

    0

    1답변

    정점이 단어에 해당하고 그래프의 가장자리가 두 정점 간의 다양한 유형의 관계를 캡처하는 간단한 그래프 표현을 만들고 싶습니다. 나는 사용되는 프로그래밍 언어에 신경 쓰지 않는다. 나는이 지식을 사용하여 자신의 응용 프로그램을 만들 수 있도록 배우기를 원합니다. 제발, 어떤 자습서, 예제, 링크 도움이 될 것입니다. 감사.

    0

    1답변

    파일 형식이 아닌 구조화되지 않은 데이터를 처리하여 처리하고 검색을 위해 database에 저장하려고합니다. 데이터는 자연 언어로 표시되며 정보를 가져 오는 쿼리는 자연어로 표시됩니다. 예 : 데이터가 일 수 있습니다. "장미가 빨간색"이고 쿼리는 일 수 있습니다. "장미의 색상은 무엇입니까?" 좀 더에 open-source 정보 추출 및 관계 추출 시스템

    0

    1답변

    내 웹 사이트에서 검색하는 사용자의 로그와 입력 한 검색어 및 클릭 한 결과가 있습니다. 검색 알고리즘을 개선하고 싶습니다. 하지만 먼저 품질을 측정 할 방법이 필요합니다. 아마존 터크 등으로 데이터를 수집하고 인간에게 테스트 스위트를 생성 할 수 있다는 것을 알고 있습니다. 그러나 내 웹 사이트 로그에서 이미 사용 가능한 데이터를 사용하고 싶습니다. 누구

    0

    1답변

    동일한 구조/스키마를 공유하는 여러 코어가 있습니다 (언어가 다름). 각 코어에 동일한 쿼리를 보내고 그 결과를 "결과"라는 새 코어에 저장합니다. 나는 그 결과 코어가 다른 코어의 점수에 의해 정렬 될 수 있도록 점수를 저장하는 커스텀 q 파서 플러그인을 가지고있다. 다른 컬렉션의 점수를 비교하는 것이 합리적입니까? 최대 점수로 나눔으로써 0과 1 사이의

    1

    1답변

    나는 WMD를 사용하여 2 개의 텍스트의 유사성을 계산하려고합니다. 내가 파이썬 3에서 다음 코드를 사용하려고 한 gensim 사용 : word2vec_model = gensim.models.KeyedVectors.load_word2vec_format('GoogleNews-vectors-negative300.bin', binary=True) word2ve

    1

    1답변

    정보 검색 용 샘플 .txt 파일을 찾고 있습니다. 등 하나 개의 주제, 예를 들어, 스포츠, 음악에 관한 문서 (약 20 문서)의 세트가있는 경우 좋을 것이다 감사

    3

    1답변

    정보 검색 평가에서 k 개 미만의 문서를 검색 할 경우 정밀도는 어떻게됩니까? 5 개의 문서 만 검색되었으며 그 중 3 개가 관련성이 있다고 가정 해 보겠습니다. 정밀도 @ 10은 3/10 또는 3/5입니까?

    1

    1답변

    자바로 검색 엔진을 구현하고 있으며 Jsoup API를 사용하여 크롤러 구성 요소를 만들고 있는데 아직 아직 이해하지 못했지만 두 가지가 있습니다. 첫째 :이 로봇에 설립되었으며으로 즉, 위키 피 디아 사이트에서 I는, 사용자 에이전트 사이트에서 차단되어 일부 크롤러가 있습니다이 private static final String agent = "Mozill