Где я могу найти документацию по формату модели языка ARPA?
Я разрабатываю приложение для простого распознавания речи с помощью механизма STT с карманным сфинксом. ARPA рекомендуется по соображениям производительности. Я хочу понять, сколько я могу сделать, чтобы настроить мою модель языка для моих собственных потребностей.
Все, что я нашел, - это очень краткое описание формата ARPA:
- http://kered.org/blog/2008-08-12/arpa-language-model-file-format/
- http://www.speech.sri.com/projects/srilm/manpages/ngram-format.5.html
- http://www.speech.cs.cmu.edu/SLM/toolkit_documentation.html
Я начинаю работать с STT, и мне сложно обернуть вокруг него (n-граммы и т.д.). Я ищу более подробные документы. Что-то вроде документации по грамматике JSGF здесь: