Я пытаюсь внедрить фреймворк P. Viola и M. Jones в С++ (вначале просто классификатор последовательности - не каскадная версия). Я думаю, что я разработал все необходимые классы и модули (например, интегральные изображения, функции Haar), несмотря на один - самый важный: основной алгоритм AdaBoost.
Я прочитал оригинальную статью П. Виолы и М. Джонса и многие другие публикации. К сожалению, я до сих пор не понимаю, как я должен найти лучший порог для одного слабого классификатора? Я нашел лишь небольшие ссылки на алгоритмы "взвешенного медианного" и "гауссовского распределения" и множество частей математических формул...
Я пытался использовать источники OpenCV Train Cascade в качестве шаблона, но он настолько всеобъемлющий, что сделать обратную разработку кода очень трудоемко. Я также закодировал свой собственный простой код, чтобы понять идею Adaptive Boosting.
Вопрос: не могли бы вы объяснить мне лучший способ рассчитать лучший порог для одного слабого классификатора?
Ниже я представляю псевдо-код AdaBoost, переписанный из образца, найденного в Google, но я не уверен, правильно ли он подходит. Вычисление одного слабого классификатора происходит очень медленно (несколько часов), и я сомневаюсь в методе вычисления наилучшего порога.
(1) AdaBoost::FindNewWeakClassifier
(2) AdaBoost::CalculateFeatures
(3) AdaBoost::FindBestThreshold
(4) AdaBoost::FindFeatureError
(5) AdaBoost::NormalizeWeights
(6) AdaBoost::FindLowestError
(7) AdaBoost::ClassifyExamples
(8) AdaBoost::UpdateWeights
DESCRIPTION (1)
-Generates all possible arrangement of features in detection window and put to the vector
DO IN LOOP
-Runs main calculating function (2)
END
DESCRIPTION(2)
-Normalizes weights (5)
DO FOR EACH HAAR FEATURE
-Puts sequentially next feature from list on all integral images
-Finds the best threshold for each feature (3)
-Finds the error for each the best feature in current iteration (4)
-Saves errors for each the best feature in current iteration in array
-Saves threshold for each the best feature in current iteration in array
-Saves the threshold sign for each the best feature in current iteration in array
END LOOP
-Finds for classifier index with the lowest error selected by above loop (6)
-Gets the value of error from the best feature
-Calculates the value of the best feature in the all integral images (7)
-Updates weights (8)
-Adds new, weak classifier to vector
DESCRIPTION (3)
-Calculates an error for each feature threshold on positives integral images - seperate for "+" and "-" sign (4)
-Returns threshold and sign of the feature with the lowest error
DESCRIPTION(4)
- Returns feature error for all samples, by calculating inequality f(x) * sign < sign * threshold
DESCRIPTION (5)
-Ensures that samples weights are probability distribution
DESCRIPTION (6)
-Finds the classifier with the lowest error
DESCRIPTION (7)
-Calculates a value of the best features at all integral images
-Counts false positives number and false negatives number
DESCRIPTION (8)
-Corrects weights, depending on classification results
Спасибо за любую помощь