Имаме големи проблеми заради нашето ДНК
Кой би си помислил, че потребителската генетика ще се роди един ден и това заплашва опасностите, които преди това са били четени най-много в научната фантастика. Днес обаче сме там, че стана изключително лесно да се идентифицират лица от анонимни DNS бази данни. Дори някой да не е давал генетична проба.

Създадено: 16 октомври 2019 г. 12:34 PM
Променено: 16 октомври 2019 г. 17:36
Потенциалните опасности от ДНК бази данни бяха подчертани за първи път през 2013 г. от биолога Янив Ерлих. Това наистина шокира изследователската общност, показвайки това използване на информация от анонимни генетични бази данни разкриха самоличността на реални хора, базирани единствено на интернет връзки. По това време, въпреки че достъпът до данни беше затегнат, правителствените служители на САЩ оцениха ситуацията, като правят вероятността от подобни резултати от изследвания много малка или по-скоро нулева за повечето хора.
Оттогава са изминали няколко години и количеството цифрова съхранена ДНК информация е нараснало експоненциално и тази тенденция продължава и днес, пише списание Wired. Данните не се събират от правителствени агенции в отделни държави, а от частни компании като 23andMe или Ancestry, които вече са създали генетичния профил на над 10 милиона души. Лицата, поръчващи генетичен профил, които изтеглят свои собствени данни, могат да изберат дали са добавени към публични уебсайтове за генеалогия, например GEDmatch, който стана известен с това, че изигра основна роля в идентифицирането и задържането на бивш сериен убиец (заподозрян по делото Golden State Killer);.
Всички вече могат да бъдат идентифицирани
Въпреки че заданията за профилиране за генетични компании идват от цял свят (включително Унгария), бизнесът с генетична търговия е създаден най-широко в Съединените щати и опасностите от него първо се появяват там, но след това изобщо не спират. Това не е само защото за малка сума (99 или 99 евро другаде, т.е. в момента 31-34 хиляди форинта) за клиенти, живеещи във всяка държава (има компания, чийто уебсайт вече има локализирани оферти на унгарски език), но и защото клиентите от европейски предци са много сериозно представени в американските бази данни. Според Ерлих, който е главен научен директор на MyHeritage, третата по големина компания след вече споменатите две компании, 60 процента от американците от европейски произход могат да бъдат идентифицирани с помощта на отворени генетични бази данни.
Ерлих и колеги от Колумбийския университет в Ню Йорк и Еврейския университет в Йерусалим анализираха данни от 1,28 милиона души и установиха, че всеки може да бъде идентифициран, ако в базата данни е включен трети братовчед или по-близък роднина. За обосноваване на тези констатации към GEDmatch бяха прикрепени 30 генетични профила и беше установено, че 76 процента от търсенията са намерили роднини до 3-ти братовчеди или по-близки връзки.
За да определят това ниво на родство, те също се нуждаят от опита от предишни известни случаи, като убиеца на Golden State и 17 други идентификации. Такъв анализ включва списък с около 850 индивида, в зависимост от това колко плодородни са били предците на този човек. Но оттам нататък основните демографски данни могат да ви доведат до точен удар доста бързо. Записите, показващи, че някой живее в рамките на 100 мили (160 километра), вече намаляват наполовина броя на кандидатите. Определянето на възрастта в рамките на пет години изключва 9 от десет останали кандидати. Полът, който може да бъде изведен от генетиката, вече намалява списъка до около 16 души. И познаването на точната година на раждане оставя само един или двама души като цели. Ерлих установи, че ако генетична база данни обхваща около два процента от пълнолетните членове на дадена етническа популация, почти всеки заинтересован може да очаква да намери 3-ти братовчед. Това означава по-малко от 160 000 души в Унгария.