Кубична роботика

Знам за проекта Cubic Robotics отдавна и бях изненадан от факта, че толкова малко хора сред моите познати знаят за него. Следователно материалът е само за информационни цели. И за да разберем напълно какво е заложено, решихме да поговорим със създателите на този робот. Така Юрий Буров, основател и главен изпълнителен директор на Cubic Robotics, отговаря на въпроси и разяснения. Но първо, кратката ми уводна реч.

Как работи? В детайли. Обяснете какво има вътре и защо е куб, а не топка или ромб?
Основата на Cubic е миникомпютър, високоговорител, микрофони, радиопредавател за управление на контакти и осветление. Основната ни разработка е сложна микрофонна система, която позволява на куба да чува на голямо разстояние, в идеалния случай до 10 метра. И, разбира се, самата „интелигентност“, гласовата операционна система VOIS (Voice интелектуална операционна система). Тя е тази, която отговаря на вашите въпроси и разбира какво казвате.
Формата на куба беше избрана от нас като най-стабилната, "монолитна". Нашият робот не планира да се движи из стаята, той трябва да се превърне в неговия „център“ и затова се нуждае от стабилност.
Освен това е доста трудно интегрирането на електронно „пълнене“ в ромбично или сферично тяло, което освен това трябва да се охлади.
Каква е скоростта на актуализиране на системата и информацията в Cubic?
Що се отнася до обмена на данни със сървъра, той се случва доста бързо и отнема много повече време, за да се изчака отговор от някои хора, отколкото от Cube. Да, за анализ на данните капацитетът на самия миникомпютър не е достатъчен и отговорите се генерират на сървъра.
Ако говорим за появата на нова функционалност и увеличаване на речника, тогава тази работа продължава, ние пускаме актуализации на всеки 1-2 дни.

Как намери своя глас и речник? Въз основа на това, което решавате кои думи и информация да добавите към мозъка Cubic?
Гласът на Kubik е решение с отворен код: ние използваме готов синтезатор на глас, най-добрият наличен в Русия. Но е напълно възможно в бъдеще да направим свои собствени.
Що се отнася до това кои думи да добавите към мозъка на куба, има много работа: екипът разполага с лингвисти и сценаристи, които отговарят за изграждането на семантични схеми. Трябва да разберете, че Кубът е приспособление, което работи с VOIS, за което вече говорихме. Основният принцип на VOIS е способността да се разбере контекста на разговора. Когато въпрос дойде на сървъра, той започва да търси опции, които могат да се появят като отговор. За целта използваме няколко различни механизма от класически чат бот до статистически алгоритъм за търсене в диалоговата база.
Например потребител попита - „Какво има на улицата“?
Има няколко възможни отговора на този въпрос. Освен всичко друго, сървърът ще разгледа следните опции:
- Навън е 25 градуса и грее слънце.
- На улицата има много сериозни задръствания, не трябва да ходите с кола.
И търсенето на успешни диалози може да даде нещо от рода на: „Можете да се убедите сами, за разлика от мен, вие имате крака“.
Може да има доста (стотици) верни отговори. Важно е да изберете този, от който потребителят се нуждае в момента. За това е отговорен алгоритъмът за проверка на контекста (статистически). Той може да покаже, че ако базата данни съдържа информация, че потребителят има кола, той най-вероятно се интересува от задръствания. И ако потребителят просто е говорил за времето (например, е поискал времето за утре), тогава е по-логично да му отговори за времето навън.
Определянето на контекста е трудно. Отчасти се основава на анализа на съществуващата база данни с правилни диалози. Някои правила трябва да се пишат ръчно, докато други следват от формалната логика. Например, най-простото и ефективно правило е, че ако два отговора са еднакво добри, тогава ще бъде избран този, чиято тема е най-близо до последния разговор.
Днес компанията има 10 души, 8 от които са тясно ангажирани в създаването на продукт и технологична платформа. Другите двама се занимават с външни комуникации, независимо дали става въпрос за комуникация с медиите или за изграждане на маркетингова стратегия и канал за продажби. Като цяло започнахме да маркетираме преди около 3 месеца, когато вече имахме готов прототип.

Обяснете, моля, защо потребителят Cubic, ако има Siri или Google Now и той не е мързелив да отиде до контакта, за да включи електронни устройства?
Като начало, Siri не говори руски. Второ, за да зададете въпрос, трябва да стартирате приложението: то не ви чува 24 часа в денонощието. Кубът, за разлика от Siri, работи 24/7, разпознаване на глас на дълги разстояния и напълно гласов режим на работа. Кубът няма екран, така че дава всички отговори изключително гласово, а също така има тенденция да води диалози и изясняващи въпроси на тези места, където мобилните асистенти показват съдържание на екрана.