Я читал теорию о дескрипторах HOG для обнаружения объекта (человека). Но у меня есть некоторые вопросы о реализации, которые могут звучать как незначительная деталь.
Относительно окна, содержащего блоки; если окно должно перемещаться по пикселю изображения по пикселям, где окна перекрываются на каждом шаге, как показано здесь:
или при перемещении окна без каких-либо перекрытий, как здесь:
Иллюстрации, которые я видел до сих пор, использовали второй подход. Но, учитывая, что окно обнаружения имеет размер 64x128, весьма вероятно, что, сдвинув окно над изображением, невозможно охватить все изображение. Если размер изображения равен 64x255, то последний 127 пикселов не будет проверять объект. Таким образом, первый подход кажется более разумным, однако, больше времени и процессора потребляют.
Любые идеи? Заранее благодарю вас.
EDIT: Я стараюсь придерживаться оригинальной бумаги Далала и Триггса. Один документ, который реализовал алгоритм и использует второй подход, можно найти здесь: http://www.cs.bilkent.edu.tr/~cansin/projects/cs554-vision/pedestrian-detection/pedestrian-detection-paper.pdf