stop-words

    0

    2답변

    파일에서 정지 단어를 제거하는 방법에 대한 많은 형식을 읽었으므로 다른 많은 것들이 제거되지만 정지 단어도 포함하고 싶습니다. 이것은 내가 얼마나 멀리 도달했는지는 모르지만 나는 무엇을 놓치고 있는지 모른다. use Lingua::StopWords qw(getStopWords); my $stopwords = getStopWords('en'); chdi

    2

    2답변

    사용자 검색어에 불용어 만 포함 된 경우 Solr에서 모든 결과를 반환하고 싶습니다. q =, (기본적으로 Solr은 0 개의 결과를 반환합니다). Solr 구성에 어떤 플래그가 있습니까? 또는이를 구현하는 데 사용할 수있는 Solr 쿼리 구문 구조를 사용할 수 있습니까? 저는 클라이언트 측에서 스톱 워드 논리를 복제하고 모든 용어가 불용어 인 경우 q=*

    1

    1답변

    내 트윗 데이터에서 다음 발행 수를 제거 할 것 내 스칼라 스크립트 내에서 불연속 단어가 있지만 정확히 일치해야합니다. 제거 할 단어의 모든 가능성을 설명하는 @ * 또는 * : *와 같은 단어를 추가하는 방법이 있습니까? val source = CSVFile("output.csv") val tokenizer = { SimpleEnglishTokeni

    0

    1답변

    MySQL에서 전체 텍스트 검색을 수행하는 데 흥미 롭습니다. 그러나 특별히 관심이있는 단어는 짧은 단어 또는 표시 될 가능성이 높은 단어입니다 중지 목록에. 예를 들어, "It is"로 시작하는 모든 항목을 검색하려고 할 수 있습니다. 가장 좋은 방법은 무엇입니까? 필자는 모든 정지 단어를 수동으로 제거하고 최소 단어 길이를 0으로 설정해야합니까? 아니면

    9

    3답변

    모든 단어를 검색 할 수 있기 때문에 정지 단어 목록을 지울 수 있습니다. 색인을 다시 작성했습니다. 하지만 안타깝게도 검색 단어에 stop 단어가 포함 된 검색 식을 입력하면 여전히 행이 반환되지 않습니다. 내가 멈추는 말을 그냥 버리면 나는 결과를 얻는다. 예 : "두 번 입는 것은 제자리에 머물러 있습니다"- 아무런 결과도없고, "두 번 입는다"- 나

    3

    1답변

    나는 트윗을 마이닝하기 위해 R을 사용했으며 트윗에 가장 자주 사용되는 단어가 있습니다. 그러나 가장 빈번한 단어는 다음과 같습니다. [1] "cant" "dont" "girl" "gonna" "lol" "love" [7] "que" "thats" "watching" "wish" "youre" 텍스트의 동향과 이름 및 이벤트를 찾고 있습니

    1

    2답변

    가능한 중복 정지 단어 목록을 읽는 방법 : Read a Text File into R 내가 개행 문자로 구분 된 텍스트 파일에있는 사용자 정의 중지 단어 목록이를 어떻게 R 스크립트에서 해당 파일을 사용할 수 있습니까? 코드 : my_stopwords <- c(stopwords(),"aint","wanna","gonna",...) 유일한 문제는 내가이

    1

    1답변

    모든 내용 단어를 빈도 차순으로 제공하는 스크립트를 작성해야합니다. 가장 자주 나오는 10 개의 단어가 필요합니다. 따라서 가장 자주 나오는 10 개의 단어 목록을 작성해야 할뿐만 아니라 모든 내용 단어 (및 또는 구두점 ...)를 필터링해야합니다. . 내가 지금까지 가지고하는 것은이 나에게 주파수의 순서를 분야별로 모든 단어의 아주 깔끔한 목록을 제공하는

    2

    1답변

    MySQL에서 전체 텍스트 검색을 사용하고 있습니다. 그러나 검색 결과가 Stopword 인 경우 검색 결과가 비어 있습니다. 내가 원하는 것은 우리가 LIKE와 함께 사용하는 것과 같은 작업입니다. 그 말은 모든 단어와 관련이 있습니다. 전체 텍스트 검색을 사용한 후에는 여러 필드와 함께 인덱스 FULLTEXT와 함께 사용할 수있는 LIKE보다 더 강력하

    0

    2답변

    두 문장 사이의 유사성 척도를 찾으려고합니다. 두 단어의 개별적인 의미 론적 유사점을 사용합니다. 그러나 제가 가지고있는 문장에서부터 많은 단어가 사전에 있습니다. 나는 그 내용에 관한 정보를 전달한다고 생각지 않는 문장에서 몇 가지 단어를 제거하고 싶다. 먼저 적은 수의 글자로 단어를 삭제했지만, 유익한 단어를 삭제하기 때문에 재결합이라고 생각하지 않습니