2017-01-10 9 views
2

나는 Aho Corasick trie를 통해 텍스트 본문을 파싱합니다. 이제이 트라이는 내 플라스크 앱의 일부로 존재합니다. 그것은 Heroku에 배치되었고 현재는 필사적으로 자동화 된 형태를 저장하고 필요할 때마다 unpickle하고 사용합니다. Aho Corasick 자동 로봇을 이와 같은 웹 앱으로 효율적으로 저장하는 더 좋은 방법은 무엇일까요?웹 응용 프로그램을위한 효율적인 트라이 스토리지

답변

2

디스크에서 트라이에 액세스하는 것은 그리 쉬운 일이 아니므로 메모리에로드하는 것이 좋습니다.

pyahocorasick 라이브러리 FWIW를 사용해보세요. http://pyahocorasick.readthedocs.io/ 님은 친구입니다. 그것은 자동으로 피클을 사용하고 메모리 사용을 제한하기 위해 컴팩트 한 메모리 구조를 사용합니다.

+0

이 링크는 질문에 대한 대답 일지 모르지만 여기에 대한 답변의 핵심 부분을 포함하고 참조 용 링크를 제공하는 것이 좋습니다. 링크 된 페이지가 변경되면 링크 전용 답변이 유효하지 않게 될 수 있습니다. - [검토 중] (리뷰/저품절 게시물/18030185) –

+1

@RobertColumbia 좋은 지적. 답변이 업데이트되었습니다! –