Я не хочу использовать программное обеспечение для чтения звука. Мне нужно следующее:
- Я записываю несколько (например, 50+) аудиопотоков (записи радиостанций)
- из этих записей, я помету интересные аудиоклипы - их длина колеблется от 2 до 60 секунд - там будет несколько тысяч таких аудиоклипов Библиотека
- должна иметь возможность находить другие экземпляры одних и тех же аудиоклипов из записанных звуковых потоков.
- следует сообщить о достоверности и использовать дополнительный вход, чтобы в следующий раз распознавание могло улучшиться.
Знаете ли вы о такой библиотеке программного обеспечения? LGPL будет для меня самым ценным, но я могу пойти и на коммерческую лицензию.
Аудиоклипы будут содержать как музыку, так и текст, эффекты или любую их комбинацию. Таким образом, распознавание TEXT не может быть и речи.
Архитектура: С++, С# для клея, CUDA, если возможно.