Обнаружение линий и фигур в OpenCV с использованием Python

Я играл с OpenCV (cv2) и обнаруживал линии и фигуры. Скажите, что моя дочь рисовала рисунок так:

введите описание изображения здесь

Я пытаюсь написать Python script, который будет анализировать чертеж и преобразовывать его в жесткие линии/фигуры, что-то вроде:

введите описание изображения здесь

Сказав это, я установил opencv и попытался поиграть с ним, но не имел никакой удачи, кроме возможности рисовать одну вертикальную линию через изображение. Ниже мой код до сих пор, любые указатели или предложения относительно того, как я должен делать это с opencv, будут очень признательны.

import cv2
import numpy as np

class File(object):
    def __init__(self, filename):
        self.filename = filename

    def open(self, filename=None, mode='r'):
        if filename is None:
            filename = self.filename

        return cv2.imread(filename), open(filename, mode)

    def save(self, image=None, filename_override=None):
        filename = "output/" + self.filename.split('/')[-1]

        if filename_override:
            filename = "output/" + filename_override

        return cv2.imwrite(filename, image)

class Image(object):
    def __init__(self, image):
        self.image = image

    def grayscale(self):
        return cv2.cvtColor(self.image, cv2.COLOR_BGR2GRAY)

    def edges(self):
        return cv2.Canny(self.image, 0, 255)

    def lines(self):
        lines = cv2.HoughLinesP(self.image, 1, np.pi/2, 6, None, 50, 10)
        for line in lines[0]:
            pt1 = (line[0],line[1])
            pt2 = (line[2],line[3])
            cv2.line(self.image, pt1, pt2, (0,0,255), 2)

if __name__ == '__main__':
    File = File('images/a.png')
    Image = Image(File.open()[0])
    Image.image = Image.grayscale()
    Image.lines()
    File.save(Image.image)

К сожалению, для простого квадратного рисования все, что я возвращаю, это:

введите описание изображения здесь

где вертикальная строка в поле является результатом кода.

Ответ 1

Вот моя попытка. Он в С++, но может быть легко перенесен на python, поскольку большинство из них - это функции OpenCV.

Краткое описание метода, комментарии в коде также должны помочь.

  • Загрузите изображение
  • Преобразование в оттенки серого
  • Binaryze изображение (порог)
  • Утончение, наличие тонких контуров и помощь findContours
  • Получить контуры
  • Для каждого контура получаем выпуклую оболочку (для обработки открытых контуров) и классифицируйте в соответствии с округлостью. Обрабатывайте каждую форму по-разному.

    • Круг: найдите минимальный круг для кодирования или лучший эллипс
    • Recrangle: найдите поле boundinx или минимальное ориентированное ограничивающее поле.
    • Треугольник: найдите пересечение минимального окружного круга с исходной формой, так как они пересекаются в трех вершинах треугольника.

ПРИМЕЧАНИЯ:

  • Мне нужно было изменить исходное изображение на 3-канальный RGB из png с прозрачностью.
  • Код прореживания от здесь. Существует также версия Python.
  • Циркулярность определяется как: A измеряет, насколько близко к кругу фигура. Например. правильный шестиугольник имеет более высокую округлость, чем квадрат. Определяется как (\ frac {4 *\pi * Area} (периметр * периметр)). Это означает, что круг имеет округлость 1, круглость квадрата равна 0,785 и т.д.
  • Из-за контуров может быть многократное обнаружение для каждой фигуры. Они могут быть отфильтрованы в соответствии, например, с пересечением по условию соединения. На данный момент я не добавил эту часть кода, так как для нее требуется дополнительная логика, которая не связана с основной задачей поиска фигур.

UPDATE - Просто заметили, что в OpenCV 3.0.0 есть функция minEnclosingTriangle. Это может быть полезно использовать вместо моей процедуры, чтобы найти вершины треугольника. Однако, поскольку вставка этой функции в код будет тривиальной, я оставлю свою процедуру в коде, если у вас не будет OpenCV 3.0.0.

Код:

#include <opencv2\opencv.hpp>
#include <vector>
#include <iostream>

using namespace std;
using namespace cv;

/////////////////////////////////////////////////////////////////////////////////////////////
// Thinning algorithm from here:
// https://github.com/bsdnoobz/zhang-suen-thinning
/////////////////////////////////////////////////////////////////////////////////////////////

void thinningIteration(cv::Mat& img, int iter)
{
    CV_Assert(img.channels() == 1);
    CV_Assert(img.depth() != sizeof(uchar));
    CV_Assert(img.rows > 3 && img.cols > 3);

    cv::Mat marker = cv::Mat::zeros(img.size(), CV_8UC1);

    int nRows = img.rows;
    int nCols = img.cols;

    if (img.isContinuous()) {
        nCols *= nRows;
        nRows = 1;
    }

    int x, y;
    uchar *pAbove;
    uchar *pCurr;
    uchar *pBelow;
    uchar *nw, *no, *ne;    // north (pAbove)
    uchar *we, *me, *ea;
    uchar *sw, *so, *se;    // south (pBelow)

    uchar *pDst;

    // initialize row pointers
    pAbove = NULL;
    pCurr = img.ptr<uchar>(0);
    pBelow = img.ptr<uchar>(1);

    for (y = 1; y < img.rows - 1; ++y) {
        // shift the rows up by one
        pAbove = pCurr;
        pCurr = pBelow;
        pBelow = img.ptr<uchar>(y + 1);

        pDst = marker.ptr<uchar>(y);

        // initialize col pointers
        no = &(pAbove[0]);
        ne = &(pAbove[1]);
        me = &(pCurr[0]);
        ea = &(pCurr[1]);
        so = &(pBelow[0]);
        se = &(pBelow[1]);

        for (x = 1; x < img.cols - 1; ++x) {
            // shift col pointers left by one (scan left to right)
            nw = no;
            no = ne;
            ne = &(pAbove[x + 1]);
            we = me;
            me = ea;
            ea = &(pCurr[x + 1]);
            sw = so;
            so = se;
            se = &(pBelow[x + 1]);

            int A = (*no == 0 && *ne == 1) + (*ne == 0 && *ea == 1) +
                (*ea == 0 && *se == 1) + (*se == 0 && *so == 1) +
                (*so == 0 && *sw == 1) + (*sw == 0 && *we == 1) +
                (*we == 0 && *nw == 1) + (*nw == 0 && *no == 1);
            int B = *no + *ne + *ea + *se + *so + *sw + *we + *nw;
            int m1 = iter == 0 ? (*no * *ea * *so) : (*no * *ea * *we);
            int m2 = iter == 0 ? (*ea * *so * *we) : (*no * *so * *we);

            if (A == 1 && (B >= 2 && B <= 6) && m1 == 0 && m2 == 0)
                pDst[x] = 1;
        }
    }

    img &= ~marker;
}

void thinning(const cv::Mat& src, cv::Mat& dst)
{
    dst = src.clone();
    dst /= 255;         // convert to binary image

    cv::Mat prev = cv::Mat::zeros(dst.size(), CV_8UC1);
    cv::Mat diff;

    do {
        thinningIteration(dst, 0);
        thinningIteration(dst, 1);
        cv::absdiff(dst, prev, diff);
        dst.copyTo(prev);
    } while (cv::countNonZero(diff) > 0);

    dst *= 255;
}


int main()
{
    RNG rng(123);

    // Read image
    Mat3b src = imread("path_to_image");

    // Convert to grayscale
    Mat1b gray;
    cvtColor(src, gray, COLOR_BGR2GRAY);

    // Binarize
    Mat1b bin;
    threshold(gray, bin, 127, 255, THRESH_BINARY_INV);

    // Perform thinning
    thinning(bin, bin);

    // Create result image
    Mat3b res = src.clone();

    // Find contours
    vector<vector<Point>> contours;
    findContours(bin.clone(), contours, CV_RETR_LIST, CV_CHAIN_APPROX_NONE);

    // For each contour
    for (vector<Point>& contour : contours)
    {
        // Compute convex hull
        vector<Point> hull;
        convexHull(contour, hull);

        // Compute circularity, used for shape classification
        double area = contourArea(hull);
        double perimeter = arcLength(hull, true);
        double circularity = (4 * CV_PI * area) / (perimeter * perimeter);

        // Shape classification

        if (circularity > 0.9)
        {
            // CIRCLE

            //{
            //  // Fit an ellipse ...
            //  RotatedRect rect = fitEllipse(contour);
            //  Scalar color = Scalar(rng.uniform(0, 255), rng.uniform(0, 255), rng.uniform(0, 255));
            //  ellipse(res, rect, color, 5);
            //}
            {
                // ... or find min enclosing circle
                Point2f center;
                float radius;
                minEnclosingCircle(contour, center, radius);
                Scalar color = Scalar(rng.uniform(0, 255), rng.uniform(0, 255), rng.uniform(0, 255));
                circle(res, center, radius, color, 5);
            }
        }
        else if (circularity > 0.75)
        {
            // RECTANGLE

            //{
            //  // Minimum oriented bounding box ...
            //  RotatedRect rect = minAreaRect(contour);
            //  Point2f pts[4];
            //  rect.points(pts);

            //  Scalar color = Scalar(rng.uniform(0, 255), rng.uniform(0, 255), rng.uniform(0, 255));
            //  for (int i = 0; i < 4; ++i)
            //  {
            //      line(res, pts[i], pts[(i + 1) % 4], color, 5);
            //  }
            //}
            {
                // ... or bounding box
                Rect box = boundingRect(contour);
                Scalar color = Scalar(rng.uniform(0, 255), rng.uniform(0, 255), rng.uniform(0, 255));
                rectangle(res, box, color, 5);
            }
        }
        else if (circularity > 0.7)
        {
            // TRIANGLE

            // Select the portion of the image containing only the wanted contour
            Rect roi = boundingRect(contour);
            Mat1b maskRoi(bin.rows, bin.cols, uchar(0));
            rectangle(maskRoi, roi, Scalar(255), CV_FILLED);
            Mat1b triangle(roi.height, roi.height, uchar(0));
            bin.copyTo(triangle, maskRoi);

            // Find min encolsing circle on the contour
            Point2f center;
            float radius;
            minEnclosingCircle(contour, center, radius);

            // decrease the size of the enclosing circle until it intersects the contour
            // in at least 3 different points (i.e. the 3 vertices)
            vector<vector<Point>> vertices;
            do
            {
                vertices.clear();
                radius--;

                Mat1b maskCirc(bin.rows, bin.cols, uchar(0));
                circle(maskCirc, center, radius, Scalar(255), 5);

                maskCirc &= triangle;
                findContours(maskCirc.clone(), vertices, CV_RETR_LIST, CV_CHAIN_APPROX_NONE);

            } while (vertices.size() < 3);

            // Just get the first point in each vertex blob.
            // You could get the centroid for a little better accuracy

            Scalar color = Scalar(rng.uniform(0, 255), rng.uniform(0, 255), rng.uniform(0, 255));
            line(res, vertices[0][0], vertices[1][0], color, 5);
            line(res, vertices[1][0], vertices[2][0], color, 5);
            line(res, vertices[2][0], vertices[0][0], color, 5);

        }
        else
        {
            cout << "Some other shape..." << endl;
        }

    }

    return 0;
}

Результаты (minEnclosingCircle и boundingRect): введите описание изображения здесь

Результаты (fitEllipse и minAreaRect): введите описание изображения здесь

Ответ 2

Вы можете проверить несколько ресурсов.

Во-первых, вы можете задать вопрос на answer.opencv.org. Вероятно, существует более высокая концентрация специалистов по opencv.

Во-вторых, книга Practical OpenCV от Samarth Brahmbhatt доступна в виде бесплатного pdf-документа и легко находится в google. Он содержит много примеров, связанных с тем, что вы ищете.

Например, вы можете разделить разные (неперекрывающиеся) контуры, как показано в примере 6.1 на стр. 68. У него есть простая программа для поиска кругов и строк в примере 6.4 на стр. 78. Вы также можете найти RANSAC (гораздо сложнее, но будет очень полезно здесь) в примере 6.5 на стр. 82.

Книга находится на С++, но я думаю, что это будет очень актуально, только вам понадобится ссылка API для перевода ее на python.

Лично для вашего projjct я бы анализировал один контур за раз, начиная с его искателя эллипса, и там, где подходящий эллипс не может быть найден, вы можете использовать преобразование Хафа регулируемого порога и обрезать результирующие линии на их пересечения и бам! У вас есть многоугольники.