Простое обнаружение объектов с использованием OpenCV и машинного обучения

Мне нужно закодировать детектор объекта (в данном случае шарик) с помощью OpenCV. Проблема в том, что каждый поиск в google возвращает мне что-то с FACE DETECTION. Так что мне нужна помощь, с чего начать, что использовать и т.д.

Некоторая информация:

  • Мяч не имеет фиксированного цвета, он, вероятно, будет белого цвета, но он может измениться.
  • Я должен использовать машинное обучение, не обязательно быть сложным и надежным, предложение KNN (это проще и проще).
  • После всех моих поисков я обнаружил, что вычисление гистограммы образцов только для шаров и обучение его ML может быть полезным, но моя главная забота здесь в том, что размер шара может и изменится (ближе и дальше от камера), и я понятия не имею, что передать ML, чтобы классифицировать для меня, я имею в виду.. я не могу (или я могу?) просто проверить каждый пиксель изображения для каждого возможного размера (от, скажем, 5x5 до WxH) и надеемся найти положительный результат.
  • Может существовать неравномерный фон, например, люди, ткань за мячом и т.д.
  • Как я уже сказал, мне нужно использовать алгоритм ML, это означает, что алгоритмы Хаара или Виолы не будут.
  • Кроме того, я думал об использовании контуров для поиска кругов на изображении Canny'ed, просто нужно найти способ преобразования контура в строку данных для обучения KNN.

    Итак... предложения?

    Спасибо заранее. ;)

Ответ 1

Ну, в основном вам нужно обнаружить круги. Вы видели cvHoughCircles()? Можно ли использовать его?

На этой странице есть хорошая информация о том, как обнаруживает материал с помощью OpenCV. Вас может заинтересовать раздел 2.5.

Это небольшая демонстрация, которую я только что написал, чтобы обнаружить монеты на этом снимке. Надеюсь, вы можете использовать часть кода в своих интересах.

Ввод: input img

Результаты: output opencv img

// compiled with: g++ circles.cpp -o circles `pkg-config --cflags --libs opencv`
#include <stdio.h>
#include <cv.h>
#include <highgui.h>
#include <math.h>

int main(int argc, char** argv)
{
    IplImage* img = NULL;

    if ((img = cvLoadImage(argv[1]))== 0)
    {
        printf("cvLoadImage failed\n");
    }

    IplImage* gray = cvCreateImage(cvGetSize(img), IPL_DEPTH_8U, 1);
    CvMemStorage* storage = cvCreateMemStorage(0);

    cvCvtColor(img, gray, CV_BGR2GRAY);

    // This is done so as to prevent a lot of false circles from being detected
    cvSmooth(gray, gray, CV_GAUSSIAN, 7, 7);

    IplImage* canny = cvCreateImage(cvGetSize(img),IPL_DEPTH_8U,1);
    IplImage* rgbcanny = cvCreateImage(cvGetSize(img),IPL_DEPTH_8U,3);
    cvCanny(gray, canny, 50, 100, 3);

    CvSeq* circles = cvHoughCircles(gray, storage, CV_HOUGH_GRADIENT, 1, gray->height/3, 250, 100);
    cvCvtColor(canny, rgbcanny, CV_GRAY2BGR);

    for (size_t i = 0; i < circles->total; i++)
    {
         // round the floats to an int
         float* p = (float*)cvGetSeqElem(circles, i);
         cv::Point center(cvRound(p[0]), cvRound(p[1]));
         int radius = cvRound(p[2]);

         // draw the circle center
         cvCircle(rgbcanny, center, 3, CV_RGB(0,255,0), -1, 8, 0 );

         // draw the circle outline
         cvCircle(rgbcanny, center, radius+1, CV_RGB(0,0,255), 2, 8, 0 );

         printf("x: %d y: %d r: %d\n",center.x,center.y, radius);
    }


    cvNamedWindow("circles", 1);
    cvShowImage("circles", rgbcanny);

    cvSaveImage("out.png", rgbcanny);
    cvWaitKey(0);

    return 0;
}

Обнаружение кругов сильно зависит от параметров cvHoughCircles(). Обратите внимание, что в этой демонстрации я также использовал Canny.