tokenize

    3

    3답변

    웹 사이트에서 긍정적 인 리뷰의 수를 계산하려고합니다. 다음 문자열을 고려하십시오. $str_1 = "This is great"; $str_2 = "This is not great after all"; $str_3 = "That isn't good and I will not return to this store."; 이는 반대입니다. 자동 분류에서

    0

    2답변

    가능한 중복 : Does xslt have split() function? 나는 각각에 대한-각각의 값을 인쇄에 사용 토큰을 반복 한 후, 내 XSL 스타일 시트에 쉼표로 구분 된 변수를 토큰 화하려면 토큰, 이걸하는 가장 좋은 방법은 뭔가? <xsl:variable name="columns" select="'EMPID,NAME,DEPT"/> <xsl:

    -2

    1답변

    내가 할 일은 다음과 같다 : 맞춤법 검사 사전 (간단한 txt 파일)을 채우기 위해 다음을 수행하는 파서 이 필요하다 : - 텍스트 파일 (또는 다른 유형의 문서) 내에서 구문 분석하고 각 단어 을 추출한 다음 간단한 텍스트 파일을 만든다. 이 같은 단어의 목록 : adfadf adfasdfa adfasfdasdf adsfadf ... 등 당신이 제안 어

    1

    2답변

    Lucene.Net 2.9.2를 사용하고 있는데 커스텀 토크 나이저를 작성해야하지만 명확한 내용이없는 경우를 확인하고 싶습니다. 이 문서는 제목, 키워드 및 내용과 함께 작성자, 날짜 등과 같이 필드로 저장된 메타 데이터로 구성됩니다. 문서는 소프트웨어 기술 문서이며 제목, 키워드 및/또는 내용에 '.Net', 'C++', 'C#'과 같은 구를 포함 할 수

    1

    1답변

    이 작업을 수행하는 특수 문자를 유지하면서 적절한 SOLR 토큰 화 텍스트를 토큰 화합니다. solr.KeepWordFilterFactory도 입력하고 모든 특수 문자는 keepwords.txt입니다. 하지만이 방법도 효과가 없습니다. 제안 사항? 나는 Solr 3.4에있다.

    0

    2답변

    CSV에서 한 줄씩 읽으며 쉼표로 구분 된 값을 토큰 화합니다. 각 토큰은 문자열 유형입니다. 그리고 그것을 float 타입의 벡터에 넣을 것입니다. 예를 들어 csv의 값이 "0.08", * beg = "0.08"이고 벡터의 값이 "0.079999998"이면 여기에 정밀도를 설정할 수 있습니까? 3 자릿수 또는 무언가로 벡터. 예 : string line

    1

    4답변

    전자 메일 주소를 토큰으로 읽으려면 어떻게합니까? 내가 토크 나이 방법은 길이가 16 비트의 한계가 있다고보고, 잘 내 토큰은 다음과 같이이다 : command [email protected] 50 내가 (이메일 주소가 될 수 있습니다) 이메일을 저장할 수 싶어 번호 (5-1500까지 다양 할 수 있음). 나는 명령 토큰에 신경 쓰지 않는다. 내 코드는

    6

    1답변

    Stopr을 가진 문구를 Solr로 검색하는 동안 문제가 있습니다. Solr은 stopword를 사용하여 결과를 보내는데 이것은 내 예상 결과가 아닙니다. stopwords.txt 파일에 "test"라는 단어가 추가되었습니다. "테스트" 나는 결과를 얻을하지 않았다 : searchword을 : 파일 schema.xml에서, 나는 일부 데이터를 색인 <fie

    0

    1답변

    이 시점에서 필자는 충분히 검색했으며이 클래스를 작동시키는 방법에 대한 좋은 예를 찾을 수 없습니다. 나는 SOLR/루씬 tokenizers의 물론 좋은 세트를 찾고 있었어요 는 수집 내가 (지금까지) 이제 내가 사용의 좋은 예를 찾고 있어요 찾을 것입니다 이 tokenizer, 거기에 내가 좋아하는 사이트/의사 어디서 이런 걸 찾을 수 있습니까? ps.

    1

    1답변

    tokenzing 입력의 결과가 토큰을 생성하는지 알아야합니다. 괜찮 으면 토큰화할 필요가 있습니다. 다른 방식으로는. 그것이 토큰을 가지고 있다면 문제가됩니다. incToken()은 일을 망가 뜨 렸습니다. 그래서 처음 엔 괜찮 았기 때문에 꼭해야 할 필요가 없을 때 다시 태어났습니다.