Я работаю над проектом, в котором у меня есть, чтобы обнаружить известную картинку в сцене в реальном времени в мобильном контексте (это означает, что я захватываю кадры с помощью камеры для смартфонов и изменяя размер рамки до 150x225), Сама картина может быть довольно сложной. Сейчас я обрабатываю каждый фрейм в среднем в 1.2 (используя OpenCV). Я ищу способы улучшить это время обработки и глобальную точность. Моя текущая реализация работает следующим образом:
- Захват кадра
- Преобразовать его в оттенки серого
- Обнаружение ключевой точки и извлечение дескрипторов с помощью ORB
- Сопоставьте дескриптор (2NN) (объект → сцена) и отфильтруйте их с помощью теста отношения
- Сопоставьте дескриптор (2NN) (сцена → объект) и отфильтруйте их с помощью теста отношения
- Несимметричное совпадение с 4 и 5.
- Вычислить доверительное соответствие (% совпадающих ключевых точек с полными ключевыми точками)
Мой подход может быть неправильным, но результаты в порядке, хотя есть много возможностей для улучшения. Я уже заметил, что извлечение SURF происходит слишком медленно, и я не мог использовать гомографию (это может быть связано с ORB). Все предложения приветствуются!