Мъртвите езици се дешифрират, превеждат се от алгоритмите за машинно обучение - Rocket

Общество на мъртвите езици
Повечето езици, които някога са съществували, вече не се говорят от хората днес. Сред изчезналите, мъртви езици можем да намерим главно тези, които смятаме за изгубени или „неразшифровани“, не знаем достатъчно за тяхната граматика, лексика, синтаксис, за да разберем текстовете им.
Изследователи от MIT са изучавали свързания с иврит угрийски език, който лингвистите предварително са дешифрирали, за да създадат система, подходяща за дешифриране на изгубени езици. (Снимка: SRK Branavan)
Изследването на изгубените езици е необходимо, защото без него знанията на цялата етническа група, която някога е живяла, ще бъдат загубени за човечеството. За съжаление, ние знаем толкова малко за повечето от тях, че учените дори не могат да ги дешифрират с помощта на усъвършенствани алгоритми за машинно обучение като Google Translate. Някои от тях дори нямат добре проучен сроден род, с който да се сравняват, и често им липсват традиционни разделители като интервали и пунктуация.
Изследователската система на MIT Computer Science and Artificial Intelligence Laboratory (CSAIL) е в състояние автоматично да дешифрира мъртъв език, така че да е известна връзката му с други езици. Като се изключи връзката между иберийския и баския език, беше демонстрирано също така, че новата система е в състояние да определя връзките между езиците независимо.
Целта на изследователите е системата им да може да дешифрира всеки мъртъв език, като използва няколко хиляди думи, които устояват на усилията на лингвистите от десетилетия.
Линейно Б писане, сричкова писменост, използвана от микенската гръцка цивилизация, т.е. От 1450г. (изображение: Wikipedia)
Дяволът в детайлите
"Системата разчита на редица принципи, основани на прозрения от историческата лингвистика, като например, че езиците обикновено могат да се развиват само по определен предсказуем начин. Например, докато даден език рядко добавя или изтрива цял звук, някои звукови замествания "Думата" p "може да се промени на" b "в родния език, но промяната на" k "е по-малко вероятно поради значителната разлика в произношението", каза Реджина Барзилай, професор от MIT, ръководен от изследователски екип.