Попугай изучает наиболее часто произносимые слова и фразы в его окрестностях, чтобы он мог повторять их в неподходящие моменты. Итак, как бы вы создали версию программного обеспечения? Предполагая, что он имеет доступ к микрофону и может записывать звук по своему усмотрению, как бы вы его кодировали, не требуя бесконечных ресурсов?
Лучшее, что я могу себе представить, - это разделить поток, используя молчание в звуке, а затем использовать некоторое распознавание образов для кодирования каждого из них в виде списка токенов, сохраняя новые, когда вы их встретите. Хешируя последовательности токенов и подсчитывая появления в базе данных, вы могли бы создать изображение наиболее часто произносимых фраз. Но учитывая огромное разнообразие фраз, как вы мешаете этому просто стать огромным списком? И огромное количество пар для соответствия, несомненно, генерирует много ложных срабатываний из комбинаторной природы соответствия.
Вы бы использовали нейронную сеть, так как это управляет реальным попугаем? Или есть другой, более умный способ сопоставления крупномасштабных шаблонов в аналоговых данных?