1,2 секунди, за да премине кубчето на Рубик ... с AI - Sciences et Avenir

Публикувано на 26.07.2019 в 22:00

Този проект на екип от изследователи от Калифорнийския университет в Ървайн (САЩ) използва алгоритъм за засилване на обучението. Методът е много популярен за програмиране на изкуствен интелект, предназначен за игра.

Вероятно трябваше да се случи. Изследователи по компютърни науки и статистика от Калифорнийския университет в Ървайн (САЩ) се сблъскаха с изкуствен интелект (AI) в пъзела с повече от 43 квинтилиона (10 30) комбинации само за 1 решение, състоящо се от получаване на лица с девет квадрати от един цвят. Статията с подробности за този проект е публикувана през юли 2019 г. в списание Nature. Алгоритъмът, наречен DeepCubeA, е успял средно за 1,2 секунди, когато записът за човек е, според последните новини, 3,47 секунди.

AI се опитва и започва отново, докато се подобри

Това е алгоритъм, съчетаващ „дълбоко учене“ и учене чрез подсилване. Първият метод позволява анализ чрез последователни слоеве на подадените към него данни. Вторият се използва широко, когато искате да „играете“ на AI. AlphaGo Zero на DeepMind, предназначен за игра на Go, беше обучен чрез обучение за подсилване, например. Светът на автономните превозни средства започва да се утвърждава.

Основният принцип е да се действа чрез проби и грешки. Алгоритъмът опитва решение и към него се връща положителен (наречен награда) или отрицателен сигнал. Той започва отначало въз основа на получената обратна връзка, получава нов сигнал и т.н. Докато постепенно се подобри и постигне желания резултат. По този начин алгоритъмът напредва сам по себе си.