Как известно, современная самая популярная CNN (сверточная нейронная сеть): VGG/ResNet (FasterRCNN), SSD, Yolo, Yolo v2, DenseBox, DetectNet - не вращаются инвариантно: современная CNN (сверточная нейронная сеть), так как DetectNet вращает инвариант?
Известно также, что существует несколько нейронных сетей с обнаружением объекта с вращающейся инвариантностью:
-
Вращающийся инвариантный неоперсептрон 2006 (PDF): https://www.researchgate.net/publication/224649475_Rotation-Invariant_Neoperceptron
-
Изучение ротации инвариантных сверточных фильтров для классификации текстур 2016 (PDF): <а4 >
-
RIFD-CNN: вращательно-инвариантные и фишер-дискриминантные сверточные нейронные сети для обнаружения объектов 2016 (PDF): http://www.cv-foundation.org/openaccess/content_cvpr_2016/html/Cheng_RIFD-CNN_Rotation-Invariant_and_CVPR_2016_paper.html
-
Закодированная инвариантность в сверточных нейронных сетях 2014 (PDF)
-
Вращающиеся инвариантные сверточные нейронные сети для предсказания морфологии галактик (PDF): <а9 >
-
Изучение вращательно-инвариантных сверточных нейронных сетей для обнаружения объектов в оптических изображениях дистанционного зондирования VHR 2016: http://ieeexplore.ieee.org/document/7560644/
Мы знаем, что в таких соревнованиях по обнаружению изображений, как IMAGE-NET, MSCOCO, PASCAL VOC - используются сетевые ансамбли (одновременно некоторые нейронные сети). Или сетевые ансамбли в единой сети, такие как ResNet (Остаточные сети, действующие как ансамбли относительно неглубоких сетей)
Но используются ротационно-инвариантные сетевые ансамбли в победителях как MSRA, а если нет, то почему? Почему в ансамбле дополнительная чередово-инвариантная сеть не добавляет точности для обнаружения определенных объектов, таких как объекты самолетов, - какие изображения выполняются под разными углами поворота?
Это может быть:
Почему ротационно-инвариантные нейронные сети не используются в победителях популярных конкурсов по обнаружению объектов?