우리는 서버 측 프로세스에서 들어오는 라이브 제어되지 않은 녹음의 다양한 웨이브 파일을 가지고 있으며 대부분은 전반적으로 선명한 음성을 제공합니다. 그러나 때로는 왜곡되거나, 정적이거나, 음성 볼륨이 충분하지 않습니다. C#을 사용하여 녹음이 "좋은"품질로 간주되는지 여부를 결정하는 효율적인 방법이 있습니까? 내가 알고있는 좋은 녹음의 스펙트로 그램을 복용
지난 3 개월 동안의 노래 검색에 echoprint API를 사용하고 있습니다. 그러나 갑자기 그것은 나보다 오류가 발생하기 시작했다. 이미 내 프로젝트에 API를 추가하는 동안 나는 많은 문제에 직면 해있다. & 이제 링커 오류가 발생하기 시작한다. 이전에 저를 위해 일하고있었습니다. 이 같은 오류 : - 시뮬레이터에 의해 사용되는 구조 인 "Codege
이것은 분명히 이상한 질문이지만 60 분짜리 MP3 믹스를 60 분 1 분 긴 wav 파일로 분할하여 Echonest와 같은 오디오 지문 인식 API와 함께 사용하는 방법을 찾고 있습니다. . 은 하나는 FFmpeg 명령이 가능 또는 I는 다음과 같은 값으로는 FFmpeg을 여러 번 반복 실행해야합니다 : -ss 초에서 시작점이다. -t는 초 단위의 지속
음악을 식별하는 echoprint echonest android 앱을 만듭니다. 나는 tutorial을 따라 갔다. echoprint codegen에 필요한 패키지는 1.54.0이고, android.mk 파일의 echoprint codegen에 포함되어있다. codegen이 사운드 코드를 생성하지만 Gangnam Style과 같은 인기있는 노래에도 일치하지
나는 마이크를 사용하여 소리를 들어야하는 애플 리케이션을 개발해야한다. 그리고 화재 경보 음이 감지 될 때마다 앱은 화재 경보가 있음을 사용자에게 알려야합니다. 이를 위해 나는 가능한 두 가지 해결책을 고민 중입니다 1 :) Speech To Text 인식기를 사용하여 연기 경보 음을 텍스트로 변환하고 그 텍스트를 저장하십시오. 그리고 다음에 연기 경고음이
pfcalc를 사용하여 사운드 클립에서 오디오 지문을 가져오고 있습니다. 그들은 다음과 같이 : 이제 필자는 다음과 같이 levenshtein 거리를 사용하여 가장 가까운 것을 찾아 내 데이터베이스에서 찾고 AQAAE5ISLVOkTEF-QfURpkGZHHeeIpehB3HMoRKaikbTKHvQNnlwpIdOxNHHY_IPJttlAECEI8BBAAgFAiig
특정 소프트웨어 (예 : SmartMusic 또는 Garageband)가 연주자가 연주하는 음악을 "듣고"잘못된 음을 감지하고 전체 점수를 제공하는 방법을 아는 사람이 있습니까? 예 : 88 %? 음높이, 리듬, 음량 및/또는 음색과 같은 다양한 기준을 사용하여 연주자가 라이브 연주 한 음악 프레이즈/발췌를 채점/점수 매기기 할 수있는 응용 프로그램을 만들
오디오 지문 인식 및 Python 인식을위한 Dejavu 라이브러리 경험이있는 사람이 있습니까? 그것은 잘 작동하지만 내가 관심이있는 것은 지금까지 난 그냥 사용하여 한 번에 하나 개의 파일을 인식 할 수있어 것입니다 것 : print djv.recognize(FileRecognizer, 'path/song_name.mp3')
사람이 어디 있다고 할 것
UNI 프로젝트에 대한 아이디어가 필요합니다. 다른 오디오 소스에서 오디오 파일을 다른 "스트림"으로 분할 할 수 있는지 궁금합니다. 예를 들어, 오디오 파일을 엔진 소음, 열차 소음, 음성, 항상 존재하지 않는 다른 소리 등으로 나눕니다. 프로그래밍 언어에서는이 작업을 수행 할 필요가 없습니다 Sound Forge와 같은 일부 사운드 프로세싱 소프트웨어를