n-gram

    2

    2답변

    최근에 n-gram과 텍스트 본문의 구의 빈도를 비교할 수있는 멋진 가능성에 대해 알아 냈습니다. 지금은 단순히 텍스트 본문을 가져오고 가장 자주 사용되는 구 (n> = 2)의 목록을 반환하는 vb.net 응용 프로그램을 만들려고합니다. 텍스트 본문에서 n-gram을 생성하는 방법에 대한 C# 예제를 발견하여 코드를 VB로 변환하는 것으로 시작했습니다. 문

    3

    3답변

    은 내가 포스트 그레스 백엔드 레일 응용 프로그램을 가지고있다. 나는 Levenshtein 거리 또는 기타 유사한 통계를 기반으로 퍼지 검색을 허용 할 전체 텍스트 검색을 추가해야합니다. 렉서/형태소 분석기가 아닌 영어 단어와 함께 일해야한다는 사실을 추가합니다 (단지 언어 별 때 렉싱, 영어 엔진으로 관련성을 고려 의미있는 단어를 가질 수있는 대상 언어에

    3

    2답변

    저는 Markov Chains을 연구 중이며, 텍스트 파일을 입력으로하여 확률 적 천이 행렬 (순서 n)을 구성하는 효율적인 알고리즘을 알고 싶습니다. 하나의 알고리즘이 끝난 것이 아닙니다. 그런 알고리즘 목록을 만들고 싶습니다. 이러한 알고리즘에 관한 논문은 용어에 관한 모든 정보 등을 환영합니다.이 주제는 n-gram 식별 알고리즘과 매우 유사합니다.

    1

    3답변

    누구든지 Google이 인기있는 통과 블록 기능을 어떻게 만들었는지 이해하거나 알고 있거나 종합 문학 또는 소스 코드를 가르쳐 줄 수 있는지 궁금합니다. 그러나, 당신이 동일한 일을 할 수있는 다른 응용 프로그램을 알고 있다면 대답을 게시하십시오. 내가 가장 많이 쓰는 내용은 here is a link to an example입니다. 당신이 게오르기 N.

    1

    3답변

    맞춤법 검사기를 변형하려고합니다. 다양한 경로를 택한 후에 (시간 효율성을 높이기 위해) n-gram 모델 사용과 관련된 구성 요소를 시험해 볼 계획입니다. 그래서 본질적으로 추가 처리를 위해 후보자 목록을 정리하고 싶습니다. 여러분은 n의 한 값 (2)을 사용하면 다른 값 (3)보다 더 좋을지 알 수 있습니까?

    3

    2답변

    스펙트럼 커널 함수는 두 문자열 사이의 동일한 n 그램을 계산하여 문자열에서 작동합니다. 예를 들어, '도구'에는 3 개의 2 그램 ('~', '~', '~')이 있으며 도구와 바보 사이의 유사성은 2입니다 ('oo'와 'ol'는 공통입니다.). 이 메트릭을 계산할 수있는 MATLAB 함수를 작성하려면 어떻게해야합니까?

    20

    4답변

    문제는 개념적으로 anagrams를 해결하는 것과 유사합니다. 다만 사전 조회 만 사용할 수는 없습니다. 나는 실제 단어보다는 그럴듯한 단어를 찾으려고 노력하고 있습니다. 나는 한 묶음의 글자를 기반으로 N-gram 모델 (현재 N = 2)을 만들었다. 자, 무작위의 문자 시퀀스가 ​​주어 졌을 때, 전이 확률에 따라 가장 가능성이 높은 시퀀스로 그들을 바

    11

    4답변

    드루팔 (Drupal의 핵심 검색 모듈)은 키워드 만 검색합니다 (예 : "샌드위치". 예 : 하위 문자열로 검색 할 수 있습니까? "샌드위치"샌드위치 결과를 돌려 주시겠습니까? 어쩌면 저기있는 플러그인이 있을까요?

    16

    2답변

    (선호하는 PHP에서) n 그램으로 일부 응용 프로그램을 구현하고 싶습니다. 어떤 유형의 n 그램이 대부분의 목적에 더 적합합니까? 단어 수준 또는 문자 수준 n-gram? PHP로 n-gram-tokenizer를 어떻게 구현할 수 있습니까? 먼저 N 그램이 정확히 무엇인지 알고 싶습니다. 이 올바른지? 그것은 n 그램을 이해하는 방법입니다. 문장 : "나