Я читаю статью об использовании CNN (сверточной нейронной сети) для обнаружения объекта.
Богатые иерархии функций для точного обнаружения объектов и семантической сегментации
Вот цитата о восприимчивом поле:
The pool5 feature map is 6x6x256 = 9216 dimensional. Ignoring boundary effects, each pool5 unit has a receptive field of 195x195 pixels in the original 227x227 pixel input. A central pool5 unit has a nearly global view,
while one near the edge has a smaller, clipped support.
Мои вопросы:
- Что такое определение восприимчивого поля?
- Как они вычисляют размер и местоположение восприимчивого поля?
- Как мы можем вычислить ограничивающий прямоугольник восприимчивого поля, используя кофе/пикафф?