Twilio может обеспечить запись звонков, но это не в режиме реального времени. Можно ли написать приложение, которое обрабатывает звук звонящего в режиме реального времени и отвечает после обработки звука? Я хотел бы, чтобы какое-то программное обеспечение "слушало" говорящего и отвечало программно.
Возможно ли получить доступ к текущему аудиопотоку в вызове Twilio?
Ответ 1
Два года спустя Twilio выпустил вариант использования, который я пытался сделать самостоятельно. Теперь у них есть служба распознавания речи в реальном времени, встроенная в Программируемый голос. Это в публичной бете: https://www.twilio.com/blog/2017/05/introducing-speech-recognition.html
Ответ 2
Twilio не предлагает способ обрабатывать аудио как вход IVR, насколько я знаю. Они предлагают использование ввода номера, но это не так разумно, как то, что вы собираетесь делать: https://www.twilio.com/docs/api/twiml/gather.
Вы можете, однако, прослушать вызов, который в настоящее время находится в процессе, с уловкой. Он должен быть настроен как конференция. Конференция может делать все, что может сделать обычный диск. Вы можете отключить некоторые дополнительные функции, а затем вы можете использовать библиотеку twilio js для незаметного присоединения к конференции и прослушивания вызова. Я полагаю, если бы вы были очень амбициозны, вы могли бы использовать какую-то речь в текстовом программном обеспечении, чтобы делать всевозможные вещи через клиента Twilio.
Смотрите annyang! для некоторой интерактивной речи с текстом: https://www.talater.com/annyang/
Ответ 3
Для людей, которые все еще ищут, Twilio теперь имеет Голосовые потоки, которые покрывают этот вариант использования! Это twiml глагол, который будет передавать аудио через веб-сокет на ваш сервер.