Идентификация на потребителя чрез движение на мишката, ph в блога, CONT

Трудно е да се надцени значението на въпросите за безопасността на личните данни и масовото наблюдение. Инженери като Джулиан Асандж и Едуард Сноудън отвориха очите на световната общност за реалните възможности на вездесъщите разузнавателни служби на различни страни. Малко по-малко внимание от световната общност се отделя на възможностите на големи информационни компании като Google, Yandex, Facebook или Vkontakte.

Тази статия ще се фокусира върху един от методите на имплицитно проследяване на потребителите на персонални компютри, базиран на анализа на биометрични данни, предоставени от потребителите доброволно и в голям обем: анализ на данните за движението на мишката.

Авторът няма доказателства за използването на описания подход от големи компании и специални служби.

Теоретична обосновка

Въпреки че курсорът на мишката изглежда плавно се движи към потребителя, движението на мишката изглежда на компютъра като последователен набор от дискретни данни. Една единица от такива данни съдържа позицията на курсора, състоянието на бутоните на мишката и текущото време на събитието. Под събитие на мишката се разбира както натискане на бутон, така и движение на самата мишка.

Потребителят премества курсора на мишката по сложна крива и със скорост, която се променя по време на движението. Както самата крива на движение на курсора, така и скоростта на движение се определят от редица физиологични и психологически фактори. Движението на мишката зависи не само от фактори като размера и теглото на ръката, положението на ръката и цялото тяло, но и от състоянието на нервната система и навиците на потребителя. Движението на курсора на мишката може да се сравни с почерка: както текстът на хартия се състои от редове, така и цифровият почерк се състои от движения на мишката. Всеки, който използва мишка, оставя подпис в този почерк в паметта на компютъра.

Според Уикипедия биометрията е разпознаване на хората въз основа на една или повече физически или поведенчески черти. Движенията на мишката са биометрични данни, тъй като представляват способността за еднозначно идентифициране на потребителя на компютъра.

Методи за събиране и анализ на данни

Въз основа на анализа на научните трудове по тази тема изглежда възможно да се идентифицират следните ключови етапи:

• събиране и предаване на сурови данни;

• съхранение на сурови данни;

• подчертаване на ключовите характеристики на данните („характеристики“);

• обучение на невронна мрежа;

• съхраняване на състоянието на невронната мрежа;

• класификация (дефиниция) на потребители, използващи обучена невронна мрежа.

Има опции за обработка на сурови данни. Някои системи на компютъра на потребителя събират данни и ги изпращат на сървъра за анализ, докато други изчисляват ключови характеристики директно на компютъра на потребителя и изпращат вече обработените данни на сървъра.

Още през 2007 г. базирани на мишки биометрични системи за идентификация на потребителите осигуряват точност от 95%. По-късно учените успяха да увеличат точността до 99,7% (три фалшиви положителни резултата на 1000 парчета данни).

Характеристики на събраните лични данни

По принцип учените си поставят задачата да идентифицират потребителя, използвайки получените биометрични данни. Идентификацията обаче не е единственото възможно приложение за този подход. Редица произведения имат приложения за следните видове информация: