За проблема с намирането на обект в изображение

1. Въведение

Класификаторът на изображения се състои от две части: екстрактора на характеристики и самия класификатор.

След това ще разгледаме различни начини за изграждане на класификатор на изображения, използвайки методите за извличане на характеристики HOG, BoW и др.

2. Хистограми на насочени градиенти (HOG)

3. Торба с думи (BoW)

Използването на методи за машинно обучение за разпознаване на обекти в изображение предполага наличието на набор от обучения, състоящ се от две (поне) части (класове):

набор от изображения, съдържащи обект (положителни примери),
набор от изображения, които не съдържат обект (отрицателни примери).

Подобно на метода TF, за да използвате метода BoW, първото нещо, което трябва да направите, е да изградите речник. Това може да стане по следния начин.

изберете метод за идентифициране на единични точки и метод за изчисляване на дескриптори за тях
за всяко изображение, включено в учебния комплект, ние дефинираме специални точки и изчисляваме дескриптори за тях
комбинираме подобни дескриптори в групи, т.е. извършваме клъстериране [6] от набора от получени дескриптори

Получените клъстери от дескриптори ще играят ролята на визуални думи и ще формират речник за честотен анализ на изображението. Функциите на BoW се извличат от изображението, както следва.

по метода, избран на етапа на съставяне на речника, определяме единичните точки в изображението и изчисляваме дескрипторите за тях
анализира намерените дескриптори по речникови клъстери
за всеки клъстер на речника пребройте броя на намерените дескриптори

По този начин векторът на характеристиките на BoW е броят на намерените дескриптори във всеки клъстер на речника.

4. Признаци на Хаар

За формиране на характеристиките на изображението се използват няколко различни характеристики на Haar, като всяка ще има свои собствени параметри - големината на площта за изчисляване на характеристиката, броят на частите, позицията на изображението.