Я использую следующую команду в SoX для разделения множества больших аудиофайлов в каждом месте, где есть тишина дольше 0,3 секунды:
sox -V3 input.wav output.wav silence 1 0.50 0.1% 1 0.3 0.1% : newfile : restart
Однако это иногда приводит к созданию файлов, которые полностью молчат и обрезают аудио до каждого разрыва.
Я нашел лучшие результаты с Audacity, но мне нужно разбить сотни WAV файлов, и Audacity не может даже открыть 10 файлов одновременно без замораживания.
Как я могу использовать SoX или подобное программное обеспечение для разделения файлов в конце периодов молчания на 0,3 секунды, так что тихая часть все еще прикреплена к концу речи, но не раньше, и нет клипов, которые полностью молчат, если они не начинаются с начала input.wav
?