В приложении мне приходится сравнивать живую запись с ранее локально сохраненной голосовой командой, если она соответствует (не только текст, но и идентифицированный голос человека), а затем выполняет необходимые действия.
1-матч голосовые команды от одного и того же человека.
текст команды с двумя совпадениями.
Я применил много способов, но никто не работает в соответствии с моими ожиданиями.
Во-первых: используйте Speech to text Library, например OpenEars, SpeechKit, но эти библиотеки преобразуют только текст из речи.
Результат: сбой как мое ожидание
Второе: (печать аудио палец)
acrcloud Library: в этой библиотеке, я записываю команду и сохраняю этот mp3файл на сервере acrcloud и сопоставляюсь с живой записью (на которой говорят я) это не соответствует, но когда я воспроизвожу одну и ту же запись (записанный MP3 файл моего голоса), который загружается на сервер acrcloud, тогда он совпадает. Результат: сбой как мое ожидание
API.AI: в этой библиотеке, это похоже на речь в текст, я сохранил некоторую текстовую команду на своем сервере, а затем кто-то говорит одна и та же команда, результат получает успех. Результат: сбой как мое ожидание
Пожалуйста, предложите мне решить эту проблему для приложения iOS