GPU ускорено разпознаване на обекти с помощта на мрежи с невронна конволюция - PDF безплатно изтегляне

Rheinische Friedrich-Wilhelms-Universität Bonn Institute for Computer Science VI Dominik Scherer GPU-ускорено разпознаване на обекти с невронни конволюционни мрежи 8 юни 2009 г. Дипломна работа Първи рецензент: Проф. Д-р Свен Бенке Втори рецензент: проф. Д-р Йоаким К. подход

разпознаване

2.4. Паралелен хардуер Фигура 2.16: SIMT архитектура: Няколко мултипроцесора със споделена памет, интегрирани в чипа (от [Nvi08c], редактиран) 16KB споделена памет, до която всички нишки на даден блок имат достъп, е почти толкова бърза, но донякъде по-гъвкава. Най-големият капацитет на графичната карта е 1 GB в паметта на устройството, което всички мултипроцесори могат да използват. Тъй като обаче тази памет има относително висока латентност, всеки мултипроцесор има 64 KB постоянна памет, която може да се чете само. Друга специална характеристика е текстурната памет, която е оптимизирана за двуизмерен достъп и чието адресиране се контролира чрез специална текстурна единица. Хостът има достъп само до паметта на устройството, всички останали области на паметта са достъпни само на графичния процесор. Скоростта на изчисление е ограничена за много алгоритми от наличната памет. Броят на блоковете, които мултипроцесор може да обработва едновременно, зависи преди всичко от два фактора: От една страна, от броя на регистрите, които една нишка изисква, и, от друга страна, от размера на споделената памет, която блок 33

4.4. Вход и изход (a) цветно изображение (b) филтър с вертикален ръб (c) филтър с хоризонтален ръб (d) компонент на яркост Y (e) компонент на цветност U (f) компонент на цветност V Фигура 4.7: Различна предварителна обработка на многоцветното входно изображение (a) Центрирано разположение (b) Случайно Разположение (c) Вертикална координатна позиция при кодиране в сиво (d) Продължаване на пикселите на ръба (e) Избледняване от ръба (f) Избледняване на продължаващите пиксели на ръба Фигура 4.8: Алтернативни опции за работа с изображение, което е твърде малко за входното ниво. 55