Я хотел бы использовать Tensorflow Object Detection API для идентификации объектов в серии изображений веб-камеры. Быстрые модели RCNN, прошедшие предварительную подготовку по набору данных COCO, кажутся подходящими, поскольку они содержат все категории объектов, которые мне нужны.
Однако я хотел бы улучшить производительность модели при определении довольно маленьких объектов в каждом изображении. Если я правильно понял, мне нужно отредактировать параметр anchor scales
в файле конфигурации , чтобы модель использовала меньшие ограничивающие поля.
Мои вопросы:
- Нужно ли мне повторно моделировать модель во всем наборе данных COCO после того, как я настрою этот параметр? Или есть способ изменить модель только для вывода и избежать любой переподготовки?
- Есть ли какие-либо другие советы/приемы для успешной идентификации небольших объектов, без обрезки изображения на разделы и выполнения вывода по каждому из них отдельно?
Фоновая информация
В настоящее время я кормлю 1280x720 изображений модели. При примерно 200x150 пикселях мне сложно обнаружить объекты.