Бъдеща дигитализация на борда от големи данни до интелигентни данни

Мюнхен 01.04.2020

Графична технология: от големи данни до интелигентни данни?

Ако данните трябва да бъдат „умни“, те трябва да бъдат подготвени съответно. Предишен проблем: Данните са много разнородни, често неструктурирани и дремещи на различни места в отделни бази данни (силози за данни). Освен това информацията обикновено не може да се търси или е много трудна за търсене.

големи

За да се възстановят скритите съкровища и да се извлекат хипотези от тях, данните трябва да бъдат достъпни, оперативно съвместими и достъпни за търсене - само тогава „Големите данни“ могат да бъдат трансформирани в „Умни данни“ чрез използването на съвременни ИТ решения. Точно върху това работи проектът „Графи за борба с диабета“ на Немския център за изследване на диабета (DZD) в Мюнхен с помощта на графична технология. Екипът се надява, че връзката и систематичният анализ на данни и а. Хипотези персонализирана профилактика и терапия. Дори с нажежена тема като инфекции на Covid-19, графичната технология може да установи връзки, които може да са останали скрити без този метод. В интервю д-р. Александър Яраш, как работи.

Д-р Александър Яраш, Мюнхен

Д-р Яраш, в света има много голяма база данни за диабет. Какъв е проблемът с това?
Има данни от различни дисциплини в основни изследвания, експерименти с животни, от епидемиологични изследвания в университети и клинични изследвания в университетски болници. Но генерираните по този начин данни обикновено се записват в така наречените силози за данни, т.е.в таблици на Excel, текстови файлове или, в идеалния случай, в бази данни. Тогава тези данни не са или са само много елементарно свързани. Ето защо е трудно да се установят връзки между различни изследователски проекти, които всички се занимават с диабета по различни начини.

И тук идва технологията за графики?
Съгласен съм. В базите данни с графики данните са свързани помежду си като така наречените възли и ръбове. Например: запазвам ИТМ, височина и така нататък върху възела на пациента. Ако след това се проведе експеримент с този пациент, при който например се взема кръв и се измерва стойността на HbA1c, създавам нов възел "вземане на кръв". С това запазвам количеството кръвна проба, стойността на HbA1c, съхранена в хладилник XY и т.н. След това възлите "Личност" и "Вземане на кръв" са свързани с ръб. Тогава мога директно да видя например каква стойност на HbA1c има човек, какъв BMI има и къде се съхранява пробата. Сега мога да търся прилики между хората и по този начин да правя хипотези за връзките. И колкото повече данни захранвам с базата данни с графики, толкова по-вероятно е да намеря корелации или модели.

Как използвате тази технология в DZD?
Например за нашето местоположение, дисциплина и различни видове заявки за експерименти и проби. Нашият член на борда на DZD проф. Мартин Храбе де Анджелис имаше визията за „каталог с данни“ в DZD. С това можем да определим относително просто: Къде се съхраняват данните? Имам ли право да работя с вас поради съображения за защита на данните? И колко проби имам? Да предположим, че искам да направя статистическо изявление за параметър в експеримент с мишка с 20 мишки. Но броят не е достатъчен, за да се правят статистически значими изявления. В базата данни с графики можете да видите, че 5800 мишки със същия параметър са измерени на друго място на DZD - и тогава мога да обединя тези данни.

Не става ли системата все по-объркваща, колкото повече данни се обединяват?
Не. Номерът е, че разполагаме с интерактивна повърхност, която лекарите и учените без опит в компютърните науки могат да използват, за да се ориентират. Можете да плъзгате възлите и ръбовете напред-назад, да ги разгъвате, за да видите подробности и свързани възли, да ги сгъвате, за да видите голямата картина. По този начин напълно нови анализи на данни могат да се управляват интерактивно. Ако броят на възлите и ръбовете стане значително по-голям, можете също да изпращате заявки към базата данни с много прост език за заявки.

Можете също така да използвате графична технология, за да свържете данни от изследвания върху различни клинични снимки?
Това е следващата стъпка. Тъй като технологията може да се използва универсално и може лесно да бъде разширена или модифицирана. И изчислителната мощ на компютрите сега е толкова голяма, че могат да бъдат обработени огромни количества данни. В момента имаме пилот с други германски центрове за здравни изследвания с 1,8 милиарда възли и 3,9 милиарда ръбове!

За какво е този пилотен проект?
Става въпрос за възможни последствия от диабет. Например, един е доста агресивен рак на черния дроб. Сега възниква въпросът: Има ли данни от пациенти или от животински модели, които биха предположили диабет за рак или обратно? Например генетичен дефект, фактор на околната среда, определен начин на живот? Възможностите за приложение на графичната технология са безкрайни. Ето защо тя ще играе все по-важна роля в бъдеще.

Благодаря ви за интервюто, д-р. Яраш!

Повече информация

Можете да прочетете повече за графичната технология в D.UTT Report 2020 на страница 160 в статията „Мрежови данни за бъдещи изследвания на диабета“ от Dr. Александър Яраш, д-р Астрид Глейзър и проф. Д-р Мартин Храбе де Анджелис.

Повече информация за проекта „Графики за борба с диабета“, който бе отличен с 2-ро място на наградата bytes4diabetes, ТУК.