0

나는 누군가가 질문을 할 때 알 필요가있는 불필요한 회의에 갇혀있는 사람들을 위해 앱을 만들고 있습니다.OS X에서 오디오 파일없이 실시간 녹음을 어떻게받을 수 있습니까?

내 계획은 다음과 같습니다

  1. 스트림 회의의 오디오 (어떤 일반적으로 내 스피커에서 나오는)
  2. 스트림 연설 - 투 - 텍스트 프로그램에 나의 이름을 감시 무언가로 및/또는 질문에 대한 억양 증가
  3. 다른 사람이 나에게 질문 할 때 "딩 (ding)"프로그램을 사용하십시오. 그런 다음 텍스트와 답변을 빠르게 읽을 수 있습니다.

단단한 부분은 단계 (1)입니다. 내가 찾은 모든 음성 - 텍스트 프로그램은 오디오 파일을 입력으로 받아 들여 스피커/헤드폰으로 전송되는 모든 채널에서 스트리밍 할 수 없습니다. 반면에 내가 찾은 보조 프로그램은 키보드 입력을 인계받습니다. 이상적으로 사용자는 회의 도중 다른 응용 프로그램을 입력하여 생산적인 작업을 할 수 있기 때문에 그런 종류의 솔루션이 작동하지 않습니다.

그래서 나는 (1) 또는 더 나은 나를 위해 위의 단계의 대부분을 단계 을 처리하는 하나의 OS X에서 사용할 수있는 무언가를 찾고 있어요.

솔루션에 대한 연구를 수행했으며 (1) 단계에 대해서는 아무 것도 찾을 수 없습니다. 내가 알지 못하는 전체 프로그램 (받아쓰기가 아닌 다른 보조 기술과 같은)을위한보다 창의적인 솔루션이있을 수 있기 때문에 나는 다른 단계를 포함하고있다.

답변

1

많은 API를 사용할 수 있습니다 (예 : streaming API from Google). 완전히 무료는 아닙니다.

정확도가 낮은 경우 CMUSphinx과 같은 오픈 소스 소프트웨어를 사용할 수 있습니다.

문제는 VoIP 소프트웨어에서 오디오 스트림을 얻는 방법이기도합니다. 직접 해킹해야합니다. 또는 스피커에서 재생되는 내용을 다시 녹음해야하므로 항상 좋은 생각은 아닙니다.

1

1) 앱 간 오디오 라우팅을 위해 LoopBack을 사용했습니다. 기본적으로 1 개의 앱에서 다른 앱으로 오디오를 파이프하는 가상 믹서입니다. 오디오 입력 장치로 표시되며 모니터링도 가능하므로 다른 앱으로 스트리밍 할 수도 있고들을 수 있습니다.

2 및 3) 내 전문 분야는 아니지만 아마 Google API를 조사하여 (Nikolay가 말한대로) 내 연구를 시작할 수 있습니다.