음성을 텍스트로 변환하는 API를 사용하여 mp3를 실행하는 데 필자는 프로그램과 라이브러리를 장기간 묶어서 구축하려고합니다. 파일을 사람이 읽을 수있는 텍스트로 변환합니다. 이 온라인 작업을 수행하는 API가 거의 없다는 사실에 놀랐습니다. speech2text 프로젝트는 Google의 비공식적 인 Speech-To-Text API에 연결되는 https://github.com/taf2/speech2text입니다.flac : "오류 : 입력 파일에 ID3v2 태그가 있습니다."
이것은 실제로 처음에 작동했습니다. 몇 가지 수동 전환을 수행했으며 그 결과에 만족했습니다. 그러나 Java에서 프로세스 체인을 자동화하려고 시도한 후 제대로 작동하지 않습니다.
EDIT - 다음 오류 메시지는 기술적으로 speech2 텍스트가 아닌 flac 자체로부터 얻은 것입니다. 이 파일을 flac 만 사용하고 speech2text를 사용하지 않고 변환하려고하면 id3v2 오류 메시지가 표시되므로 speech2text와 오류가 실제로 발생하지 않습니다 (speech2text가 잘못된 태그의 소스 일 수 있음).
Java는 이것을 오류 (스트림을 ProcessBuilder를 사용하여 호출 speech2text을 가진 밖으로 인쇄 후) : 코스의
ERROR: input file ./chunk-abortion-test-audio-0.mp3 has an ID3v2 tag /Library/Ruby/Gems/1.8/gems/speech2text-0.3.4/lib/speech/audio_splitter.rb:59:in
to_flac': failed to convert chunk: ./chunk-abortion-test-audio-0.mp3 with flac ./chunk-abortion-test-audio-0.mp3 (RuntimeError) from /Library/Ruby/Gems/1.8/gems/speech2text-0.3.4/lib/speech/audio_to_text.rb:18:in
to_text' from /Library/Ruby/Gems/1.8/gems/speech2text-0.3.4/lib/speech/audio_to_text.rb:17:ineach' from /Library/Ruby/Gems/1.8/gems/speech2text-0.3.4/lib/speech/audio_to_text.rb:17:in
to_text' from /Library/Ruby/Gems/1.8/gems/speech2text-0.3.4/bin/speech2text:11 from /usr/bin/speech2text:19:in `load' from /usr/bin/speech2text:19
그러나
/Library/Ruby/Gems/1.8/gems/speech2text-0.3.4/lib/speech/audio_inspector.rb:50:in
initialize': undefined method
first' for nil:NilClass (NoMethodError) from /Library/Ruby/Gems/1.8/gems/speech2text-0.3.4/lib/speech/audio_splitter.rb:77:innew' from /Library/Ruby/Gems/1.8/gems/speech2text-0.3.4/lib/speech/audio_splitter.rb:77:in
initialize' from /Library/Ruby/Gems/1.8/gems/speech2text-0.3.4/lib/speech/audio_to_text.rb:15:innew' from /Library/Ruby/Gems/1.8/gems/speech2text-0.3.4/lib/speech/audio_to_text.rb:15:in
to_text' from /Library/Ruby/Gems/1.8/gems/speech2text-0.3.4/bin/speech2text:11 from /usr/bin/speech2text:19:in `load' from /usr/bin/speech2text:19
, 같은 파일에 수동으로 명령을 실행하려고하면 실제로 저에게이 있습니다 아이러니 내가 여기에 내가 실제로 id3v2 태그 파일을 정리했습니다. Mac 터미널에서 id3v2 --delete-all
을 사용합니다. 그래서 무언가가 계속되고 있습니다.
아무도 무슨 일이 일어나고 있는지 제안 할 수 있습니까? 또한 speech2text가 1 년 만에 업데이트를 보지 못했다는 사실을 감안할 때 사람들이 사용하는 최신 음성 - 텍스트 솔루션이 있어야하는 것 같습니다. 그래서 거기에 더 나은 것이 있으면 알려주세요.
건배!
EDIT - 덧붙여 말하자면 누군가 mp3 파일이 ffmpeg를 사용하여 .flv 파일을 스트립하는 것으로부터 시작된 것이라면.