API распознавания звука, SDK (Android)

Мне нужно сделать приложение для Android, которое может распознать определенные звуковые файлы, созданные мной, и выполнить действие по распознаванию. Так что что-то похожее на Shazam/Soundhound, но с моими собственными звуковыми файлами. Есть ли API или SDK или что-то в этом роде? Я читал об Echoprint, но я понимаю, что это для Windows и iOS, и мне кажется, что это довольно сложно. Будет ли это работать? Или есть другие варианты?

PS: Чтобы было ясно, я не хочу распознавать голос или текст в речь. Мои звуковые файлы могут содержать музыку, искаженный голос, эффекты и т.д.

Ответ 1

Через год я закончил использование Echoprint для Android, как описано здесь. Он получает некоторые результаты, но в целом он работает довольно плохо, особенно с пользовательскими звуковыми файлами. Echoprint не предназначен для распознавания OTA. Я бы рекомендовал его для тестирования/прототипирования, но не для производства. К сожалению, пока это единственный, позволяющий вам иметь собственные серверные и звуковые файлы.

Ответ 2

ACRCloud поддерживает поисковую систему Music/Audio, поддерживается 50 миллионов песен/контент для загрузки пользователей, SDK для iOS/Android/Linux, который можно загрузить после регистрации (http://console.acrcloud.com/signup). Для клиентов существует три уровня:

Свободный уровень для демонстрации/прототипирования
Ускоряющий уровень, для стартапов
Коммерческий уровень

пожелайте, чтобы это помогло