는 BBC 운송 예보의 다운로드 버전을 읽을 수 있습니다. 라이브 라디오에서 iplayer로 파일을 잘라내는 것은 분명히 자동화되어 있으며 정확하지는 않습니다. 따라서 대개 예측 자체가 시작되기 전에 오디오가 있거나 예고편 또는 뉴스가 끝납니다. 정확할 필요는 없지만 음성 인식을 통해 "그리고 지금은 배송 예측"(또는 '배송'이 실제로 가능할 것입니다) 문구를 인식하고 거기에서 파일을 잘라내고 싶습니다.오디오 파일 음성 인식 - 초 단어의 위치 나 파이썬 음성 인식 라이브러리 <a href="https://pypi.python.org/pypi/SpeechRecognition/" rel="nofollow noreferrer">https://pypi.python.org/pypi/SpeechRecognition/</a></p> <p>을 실험했습니다
지금까지의 내 코드 (예 : adpated form)는 예측의 오디오 파일과 필사본을 전달하고 분당 200 단어를 기반으로하는 공식을 사용하여 출하 단어가 어디서 왔는지 예측하지만 매우 정확하지는 않습니다.
실제 '프레임'을 얻는 방법이나 그 단어에 대해 pocketsphinx 자체가 감지 된 두 번째 시작 방법이 있습니까? 문서에서 아무것도 찾을 수 없습니다. 누구든지 어떤 아이디어?
import speech_recognition as sr
AUDIO_FILE = path.join(path.dirname(path.realpath(__file__)), "test_short2.wav")
# use the audio file as the audio source
r = sr.Recognizer()
with sr.AudioFile(AUDIO_FILE) as source:
audio = r.record(source) # read the entire audio file
# recognize speech using Sphinx
try:
print "Sphinx thinks you said "
returnedSpeech = str(r.recognize_sphinx(audio))
wordsList = returnedSpeech.split()
print returnedSpeech
print "predicted loacation of start ", float(wordsList.index("shipping")) * 0.3
except sr.UnknownValueError:
print("Sphinx could not understand audio")
except sr.RequestError as e:
print("Sphinx error; {0}".format(e))
사용 이진 검색 또는 유사한 원본 또는 이와 유사한 예를 절반위한 새로운 웨이브 파일을 생성 후 부분이 들어있는 알 단어'배송 '... 등 –