Как работят DLP системите, ние разбираме технологиите за предотвратяване на изтичане на информация

Съдържанието на статията

За да бъдем доста последователни в дефинициите, можем да кажем, че информационната сигурност започна точно с появата на DLP системите. Преди това всички продукти, които се занимаваха с „информационна сигурност“, всъщност защитаваха не информация, а инфраструктура - места за съхранение, предаване и обработка на данни. Компютърът, приложението или каналът, в който се намира, обработва или предава поверителна информация, е защитен от тези продукти по същия начин, както инфраструктурата, в която циркулира напълно безвредна информация. Тоест с появата на DLP продукти информационните системи най-накрая се научиха да разграничават поверителната информация от неповерителната. Може би с интегрирането на DLP технологиите в информационната инфраструктура компаниите ще могат да спестят много на защитата на информацията - например, да използват криптиране само в случаите, когато поверителната информация се съхранява или предава, а не криптират информация в други случаи.

Лингвистичен анализ

Използването на стоп думи („секретно“, „поверително“ и други подобни) за блокиране на изходящи имейл съобщения в пощенските сървъри може да се счита за родоначалник на съвременните DLP системи. Разбира се, това не предпазва от натрапници - не е трудно да се премахне думата за спиране, която най-често се поставя в отделен печат на документа, а значението на текста изобщо няма да се промени.

Развитието на лингвистичните технологии беше изтласкано в началото на този век от създателите на имейл филтри. На първо място, за защита на имейлите от нежелана поща. Сега в технологиите за борба със спама преобладават репутационните методи, а в началото на века имаше истинска лингвистична война между снаряда и бронята - спамерите и антиспамерите. Помните ли най-простите техники за заблуждаване на филтри, базирани на стопворд? Замяна на букви с подобни букви от други кодировки или цифри, транслитерация, произволно разположени интервали, долни черти или прекъсвания на редове в текста. Анти-спамерите бързо се научиха да се справят с подобни трикове, но след това се появиха графичен спам и други хитри видове нежелана поща.

Технологични предимства

Недостатъци на технологията

В Германия американските производители на лингвистични технологии срещнаха друг проблем - така наречените "съединения", сложни думи. На немски език е прието да се прикачат дефиниции към основната дума, в резултат на което се получават думи, понякога състоящи се от десет корена. В английския език няма такова нещо, там думата е последователност от букви между две интервали, съответно английският лингвистичен двигател не е в състояние да обработи непознати дълги думи.

Статистически методи

Проблемът с компютърното търсене на значими цитати (защо точно „значителни“ - малко по-късно) интересува лингвистите още през 70-те години на миналия век, ако не и по-рано. Текстът беше разбит на парчета с определен размер, от всеки от които беше взет хеш. Ако някаква последователност от хешове е възникнала едновременно в два текста, тогава с голяма вероятност текстовете в тези области съвпадат.