Есть ли у кого-нибудь, кто имеет опыт работы с любым открытым исходным кодом или относительно дешевым API распознавания речи для java? Я в значительной степени ищу что-то, что превратит произносимые слова в текст.
Из страницы распознавания речи Java на солнце, кажется, что это нечто, что скорее мертво. Мои требования - это то, что по крайней мере работает на linux.
Кто-нибудь может что-то рекомендовать? Чистая java была бы бонусом, иначе можно было бы рассмотреть решение на базе Linux. А поскольку это домашний проект... тем дешевле, чем лучше.
- Изменить
CMU Sphinx Как отметил Амит, CMU Sphinx http://cmusphinx.sourceforge.net/html/cmusphinx.php Моя проблема - это массовый уровень ошибок в сообщениях. Обучение похоже на проект само по себе, я надеюсь собрать силы, чтобы попробовать это в эти выходные.
IBM ViaVoice
В течение 2004 года в новостях появились сообщения о Via Voice, созданный с открытым исходным кодом. Кажется, пресс-релиз был преждевременным, и этого никогда не было. В какой-то момент VIA Voice был выпущен для Linux, но кажется, что они остановились. Все, что, кажется, осталось на веб-сайте IBM, ViaVoice embedded.
IBM Websphere Voice
Я предполагаю, что именно поэтому ViaVoice (рабочий стол) кажется прекращенным. IBM создала это коммерческое решение, которое будет стоить больше, чем рука и нога. И только использование этого приведет к тому, что вы оставили, по крайней мере, после моего опыта работы с websphere и их IDE.
Nuance
Кажется, они все равно могут создавать продукты для Linux. Но я думаю, что они потерялись и последовали за IBM на серверный рынок. Я не уверен в этом, их веб-сайт не так дружелюбен в поиске полезной информации.
Открытый ум/Свободная речь
Эти ребята продолжают менять название своего проекта. Наверное, какая-то голодная компания держит их в опасности, но я не знаю. Проект выглядит немного мертвым.
Я мог бы попробовать тренировать Сфинкса в эти выходные, чтобы посмотреть, хочет ли он быть друзьями. В еще худшем случае я буду рассматривать использование речевого решения Microsoft. В прошлом он работал хорошо для меня, но это не отличное решение для Linux. Я мог бы использовать его через вино, но тогда у меня будет два отдельных сервера... грязный беспорядок.
О, и что кажется хорошим местом для посещения для голоса/речи SpeechTechMag. У них есть "Anual Reference", в котором есть список компаний, которые каким-то образом связаны с голосом и речью.