aho-corasick

    4

    2답변

    최근에 centos5.8_x64에서 python2.7.5와 함께 ahocorasick을 사용하려고했지만 결과가 비정상 인 것으로 나타났습니다. 이유를 말씀해 주시겠습니까? 모듈 실행을 발견했습니다. python2.7.5와 완벽하게 내 윈도우 7에 있습니다. 여기에 내 테스트 코드와 리눅스에서 결과입니다. >>> import ahocorasick >>> t

    0

    1답변

    사용자가 입력 파일을 통과하고 일치 항목을 검색 할 수있는 여러 정규 표현식을 입력 할 수있게 해주는 스크립트를 작성하려고합니다. 현재 ahocorasick을 사용하고 있지만 정규식 패턴을 입력하려고 할 때 문제가 발생합니다. 나는 두 번째 raw_input을 (colour_regex)에 정규식을 입력하지만, 다음이 오류가 나타납니다 올바른 방향으로/지침

    -1

    2답변

    이제는이 알고리즘에 관한 이전 질문이 있다는 것을 알고 있습니다. 그러나 솔직히 간단한 Java 구현을 발견하지 못했습니다. 많은 사람들이 동일한 코드를 GitHub 프로필에 복사하여 붙여 넣었습니다. 인터뷰 연습을 위해 나는 다른 접근 방식을 사용하여 알고리즘을 설정하고 구현할 계획이었습니다. 알고리즘은 매우 어려운 경향이 있습니다. 나는 정직하게 그것에

    1

    1답변

    내가이 exercice에 문제가있는 범위는 얼마나 많은 문자열 큰 숫자에서 찾을 수 있습니다 : 범위 을 감안할를1 <= A,B <= 10^18 및 1 <= i <= 1000와 문자열 Ni를 나타내는 몇 가지 정수와 B에; 는 A, B 주어진 문자열 중 하나를 포함 ( 및 B 포함) 사이의 범위에서 가능한 한 숫자의 수를 반환한다. 입력 예 A, B, i

    1

    1답변

    위키 대타 (Wikidata)의 수백만 명으로 구성된 유명한 사람들의 목록을 가지고 있으며, 나는 모든 사람들을 매우 짧은 텍스트로 효율적으로 찾아내는 시스템을 만들어야합니다. 이것은 단지 한 단어 일 수 있습니다 (예 : "Einstein"). 몇 페이지의 텍스트 (예 : Wikipedia 페이지). 맞춤법 오류 (예 : 마이클 잭슨 대신 미카엘 잭슨)

    1

    2답변

    건초 더미에서 선형 시간으로 각 바늘의 수를 계산하는 방법을 궁금해하고있었습니다. 나는 Aho-Corasick 알고리즘을 사용할 것이라고 생각했지만 시간 복잡성은 바늘의 발생 횟수에 의존하기를 원하지 않습니다.

    2

    1답변

    나는 Aho Corasick trie를 통해 텍스트 본문을 파싱합니다. 이제이 트라이는 내 플라스크 앱의 일부로 존재합니다. 그것은 Heroku에 배치되었고 현재는 필사적으로 자동화 된 형태를 저장하고 필요할 때마다 unpickle하고 사용합니다. Aho Corasick 자동 로봇을 이와 같은 웹 앱으로 효율적으로 저장하는 더 좋은 방법은 무엇일까요?

    2

    1답변

    파이썬에서 ahocorasick 모듈을 사용하여 트리에 추가 할 때 세그먼트 오류가 발생했습니다. 동일한 결과를 보았습니다. 0.9과 1.0pre를 사용하면 도움이 될 것입니다. 감사합니다. [[email protected] ~]$ python Python 2.6.6 (r266:84292, Jan 22 2014, 09:42:36) [GCC 4.4.7 2

    1

    1답변

    그렇다면 정확한 문자열 일치를 위해 접미어 트리에서 접미사 링크의 목적을 설명 할 수 있습니까?

    2

    1답변

    Aho-Corasick 알고리즘의 두 가지 패턴에 대한 상태 전이 테이블 구성을 이해하도록 도와주십시오. 이해할 수 있도록 간단하고 자세한 설명을하시기 바랍니다. 나는 this 종이이고 here은 그 애니메이션입니다. 감사합니다. 예를 들어 의해 Starting at the root, follow the path labeled by chars of Pi