Я пытаюсь понять, как использовать sphinx4 или pocketsphinx с английской моделью voxforge, но я не могу заставить его работать. Я попытался прочитать страницы документа (например, http://cmusphinx.sourceforge.net/sphinx4/doc/UsingSphinxTrainModels.html), но это мне не помогает.
Что я хочу - это исполняемый файл, в котором я могу указать, какую модель использовать и какой аудиофайл использовать в качестве источника, и чтобы исполняемый файл распечатывал его, лучше всего догадываться о том, что говорит голос в записи.
Мне повезло: pocketsphinx_continuous -infile recording.wav 2 > /dev/null
Но он прерывается до того, как полный аудиофайл транскрибируется, а модель по умолчанию имеет несколько слов для создания читаемого текста из аудио.
Я скомпилировал и протестировал демонстрацию в исходном пакете sphinx4, но все примеры, похоже, имеют несколько слов и нуждаются в модели, чтобы использовать voxforge для меня.
Как я могу настроить это?