길쌈 된 신경 회로망을 훈련시키기 위해 .wav 파일을 분류했습니다. 이것은 표준 Dataset을 사용할 수없는 Bengali 전화 용입니다. 내 CNN 모델을 교육하기 위해이 .wav 파일을 Tensorflow에 입력하고 싶습니다. 내 모델에 대해 입력되는이 .wav 파일에서 그레이 스케일 스펙트로 그램을 만들고 싶습니다. 그렇게하는 방법에 도움이 필요합니다. 하나 이상의 대안이 있다면 그들의 힘과 약점은 무엇입니까?tensorflow에 음성 훈련 데이터를 추가하는 방법
또한 길이가 가변적이며 일부는 70ms이고 일부는 160ms입니다. 20ms 단위로 나누는 방법이 있습니까?
사람이 librosa 어떤 예제를 제공하기 matplotlib 수 있습니까? –
마침내 50ms의 지속 시간으로 내 .wav 파일에서 그레이 스케일 스펙트로 그램을 만들었습니다. 누구든지 코드에 관심이 있다면 게시 할 수 있습니다. –