2014-10-01 6 views
0

현재 근무중인 프로젝트에서 OpenNLP를 사용하려고하고 있습니다. 매우 익숙합니다. 나는 에있는 교육 자료와 함께 Named Entity Recognition을 사용해 보았습니다. 그러나 사용 된 교육 데이터를보고 싶습니다. 실제로 .bin 파일을 열고 영어로 내용을 볼 수 있습니다. 수있는 하나의 pls 올바른 방향으로 나를 가리 킵니다. .bin 파일을 읽기 위해 UltraISO를 사용하려고했지만 성공하지 못했습니다. PLS가 도움이됩니다. 고맙습니다 :)opennlp에서 .bin 파일의 내용을 보려면 어떻게해야합니까?

+0

'bin'은 파일이 * * * 평문 일 수 있음을 나타내는 * generic * 파일 확장자입니다. (특히 "ISO"와는 아무런 관련이 없습니다.) 파일을 열려면 올바른 소프트웨어가 필요하거나 파일 형식의 사양을 어딘가에 찾아서 읽을 수있는 소프트웨어를 작성해야합니다. – usr2564301

답변

0

file en-token.bin과 같은 파일 형식을 찾으려면 유닉스 file 명령을 사용하십시오. 대부분의 OpenNLP .bin 파일에서 이것은 단지 ZIP 파일이라는 것을 알려줍니다.

0

bin 파일은 실제로 NameFinderME (ME는 OpenNLP에서 사용되는 주요 다항 로지스틱 회귀 (ish) 알고리즘 인 최대 엔트로피를 의미 함)를 나타내는 TokenNameFinder 구현을 나타내는 직렬화 된 Java 객체의 바이트입니다. 이 파일에 대해 아무 것도하지 않으면 교육 데이터를 볼 수 없습니다. 수정 : 이름 찾기가 아니며 이름이 serialize 된 MODEL입니다.