Как големите данни трансформират света Les Echos

Обработката на „големи данни“ не се ограничава до анализ на сложни явления: това също ще промени нашите икономики и нашето общество.

големите

Това е логичната последица от тежестта, която цифровите технологии поеха в нашия живот: данните се умножават с главоломна скорост. Произведени от нашите компютри, мобилни телефони, платежни инструменти, но също така и от множеството сензори, които сега оборудват нашите автомобили, пътища или домове, тези данни се предават на хиляди „центрове за данни“, които ги съхраняват, анализират и кръстосват -проверете ги. "Всяка минута около 300 000 туитове, 15 милиона текстови съобщения, 200 милиона имейла се изпращат по целия свят, докато десетки часове видео се качват в YouTube и 250 гигабайта информация се архивират. На сървърите на Facebook", пише Gilles Babinet в въведение към последното му есе.

Това явление само по себе си не е ново: терминът "информационна експлозия" се появява за първи път в "Оксфордския английски речник" през 1941 г., с други думи в праисторията на компютърната ера. Новостта е, че през последните десет години беше възможно да се използва този потоп от данни: „Ново поколение алгоритми [позволява] тези данни да се управляват стотици и хиляди пъти по-бързо от„ преди. Това е това, което обикновено се нарича „Големи данни“ - или на френски „големи данни“, съгласно официалната препоръка (но рядко следвана) на Генералната делегация за френския език.

Предскажете и реагирайте

Първият председател на Националния съвет по цифрови технологии, днес представител на Франция за цифровата икономика в Европейската комисия, Жил Бабине познава добре Big Data: през 2009 г. той създаде един от първите френски стартиращи фирми, специализирани в анализа на големи данни, капитан Даш. Първата глава от неговата книга излага с голяма педагогика математическите основи (топологични модели, теория на графовете) и технологичните иновации (Google File System, Hadoop.), Които позволяват да се анализират големи количества разпръснати и неструктурирани данни. За извличане на информация - по принцип - релевантно. Резултатът е голяма промяна в историята на човешкото познание: за първи път, когато става въпрос за анализ на сложно явление, причинно-следствените връзки ("това обяснява това") са по-малко важни от корелациите ("ако множество очевидно изолирани фактори присъстват, резултатът трябва да бъде идентичен ").

Но истинската революция не спира с обикновен анализ. Инструментите за големи данни вече са в състояние да предсказват поведение или събития и дори да реагират по съответния начин: това е ролята на „учебните машини“, които всъщност представляват набори от алгоритми, способни да задействат действие - чрез пример за откриване, от информацията, записана от сензорите и историята на данните, когато машината се повреди, за да предупреди следпродажбеното обслужване. Това, което Жил Бабинет обобщава с шокираща формула: „Големите данни не са просто технология, а нова информация и структура на управление. Така че това е нов начин за взаимодействие с реалността. "