Я делаю некоторое исследование о том, как сравнивать звуковые файлы (волна). В основном я хочу сравнить сохраненные звуковые файлы (wav) со звуком от микрофона. Поэтому, в конце концов, я хотел бы предварительно сохранить некоторые собственные голосовые команды, а затем, когда я запускаю свое приложение, я хотел бы сравнить предварительно сохраненные файлы с входом от микрофона.
Моя мысль заключалась в том, чтобы придать некоторый запас при сравнении, потому что говорить что-то два раза подряд по-разному было бы трудно, я думаю.
Итак, после некоторого googling я вижу, что у python этот модуль называется wave и Wave_read. Этот объект имеет функцию с именем readframes (n):
Считывает и возвращает не более n кадров audio, в виде строки байтов.
Что содержат эти байты? Im думает о петлях через волновые файлы с одним фреймом во время сравнения их по кадру.