Использовать API обнаружения объектов Tensorflow для обнаружения небольших объектов в изображениях

Я хотел бы использовать Tensorflow Object Detection API для идентификации объектов в серии изображений веб-камеры. Быстрые модели RCNN, прошедшие предварительную подготовку по набору данных COCO, кажутся подходящими, поскольку они содержат все категории объектов, которые мне нужны.

Однако я хотел бы улучшить производительность модели при определении довольно маленьких объектов в каждом изображении. Если я правильно понял, мне нужно отредактировать параметр anchor scales в файле конфигурации , чтобы модель использовала меньшие ограничивающие поля.

Мои вопросы:

  • Нужно ли мне повторно моделировать модель во всем наборе данных COCO после того, как я настрою этот параметр? Или есть способ изменить модель только для вывода и избежать любой переподготовки?
  • Есть ли какие-либо другие советы/приемы для успешной идентификации небольших объектов, без обрезки изображения на разделы и выполнения вывода по каждому из них отдельно?

Фоновая информация

В настоящее время я кормлю 1280x720 изображений модели. При примерно 200x150 пикселях мне сложно обнаружить объекты.

Ответ 1

  • Вам нужно будет переучиться полностью, к сожалению, поскольку весы зависят от формы якоря.

  • Наличие карты функций с более высоким разрешением должно помочь (но замедлить процесс), поэтому изменение экстрактора функций для получения меньшего размера (максимальное количество пулов с шагом > 1 обычно уменьшает размер пространства ) или немного масштабировать изображение в исходном изображении.