나는 음성을 텍스트로 변환하는 방법을 고안하고있다. 이를 달성하기 위해 Sphinx을 사용하려고합니다. 나는 텍스트에 대한 유도되지 않은 연설이 의미하는 바는 연사가 명확한 문장 집합으로 말하기 쉽지 않다는 것입니다. 오히려 그는 어떤 문장을 말할지도 모른다. 따라서 문법 파일을 가질 수는 없습니다. 각 단어는 문법 파일에 미리 쓰여진 대안 중 하나입니다.
저는 현재 Sphinx4에서, 특히 TranslatorDemo에서 일하고 있습니다. 그러나 그것을 실행할 때 기본 사전과 모델은 숫자 만 출력합니다. 지시 사항은 내가 가지고있는이 특정 모델에 대한 config.xml 파일을 변경한다고하지만, 그것을 읽는 것은 나에게 혼란스럽고 사전 이름을 바꾸려는 몇 가지 시도는 효과가없는 것처럼 보입니다. 내가 자리 이
그래서 shift 버튼을 누르고있을 때만 들리는 sphinx-4 프로그램을 만들고 있습니다. 이것은 내가 실수를 막을 수 있고, 내가 시프트 버튼을 누르고있을 때만 내 말을들을 수있게하기 위해서입니다. Shift 버튼을 놓으면 프로그램을 다시 열 때까지 기다려야합니다. ctrl-c를 누르면 프로그램이 완전히 종료됩니다. 나는 키 릴스터를 사용하여 이것을하고
특정 키워드가 입력 될 때까지 sphinx4를 사용하여 스레드를 일시 중지합니다. recognizer.recognize()
이 실행되지 것 같다 응용 프로그램 그냥 스팸 시작, 이번이 처음이 잘 작동하지만, 두 번째는 내가 스레드를 일시 중지해야 "시작 말하기 ...". 여기 스레드 일시 정지하는 기능입니다 : public synchronized voi
현재 일기를 사용하여 내 Java 코드를 만들려고하고 있는데 특정 기능이 있다고 말하면 일부 기능을 수행하려고합니다. 나는 Sphinx4 라이브러리를 사용하고이 내가 현재 가지고있는 것입니다 : 안녕하세요 IF (TRUE) someFunction();
내 음성 인 경우 기능을 실행하는 것입니다 : 내가 그것을 할 싶습니다 어떤 것은 말하는 줄입니다 컴퓨
먼저 무슨 일이 일어나는지 설명하겠습니다. 저는 Sphinx 4를 음성 인식에 사용하고 있습니다. 음성 인식에 전혀 경험이 없기 때문에 Sphinx 4를 잘 사용하지 못합니다. 기본적으로 나는 JARVIS 타입의 물건을 정교하게 만들지 않으려 고 노력하고있다. 처음에 할 일은 단순히 '포토샵 시작'과 같은 미리 만들어진 명령으로 내 컴퓨터를 탐색하는 것입니
javafx 창과 sphinx 응용 프로그램을 시작할 때 스핑크스를 먼저 실행 한 다음 창을 시작하면 프로그램이 명령을 기록하지 않습니다. 나는 보통 창문을 스핀 덱스 레코드처럼 시작하지만 창을 막는다. 내 창 마이크에 public class Escolha extends Application{
private static final Image FOTOPRO
LatticeDemo.java를 시도했습니다. 그리고 예제 결과에 표시된 결과를 얻을 수 있습니다. 이 예에서는 음성 데이터 (10001-90210-01803.wav)에 "AudioFileDataSource"를 사용하고 있습니다. StreamDataSource를 사용하여이 음성 데이터를 다른 방식으로 인식하려고합니다. 그러나 나는 다른 결과를 얻습니다. 나
처음에는 스핑크스 4를 작동시키는 데 문제가 있었지만 현재는 작동합니다. 문법은 JSGF 나 N-Gram과 같은 유한이기 때문에 가능한 모든 단어 나 문장을 스핑크스로 인식 할 수 없습니다. 음성 기반 Google 검색과 같은 것을 만들고 싶습니다. 검색에는 가능한 모든 단어 또는 단어 조합이있을 수 있습니다. 모든 사전 단어를 문법에 추가하는 것은 번거로
Java에서 Sphinx4을 입력하고 네트워크를 통해 InputStream의 입력을 사용하려고합니다. 현재 내 프로그램은 네트워크에서 들어오는 임의의 수의 패킷을 all_data이라는 배열로 읽도록 설정되어 있습니다. 그로부터 ByteArrayInputStream을 만듭니다. 내가 할 수 있기를 바랄 수있는 것은 그것을 인식하기 위해 스핑크스에 전달하는 것