Статистика за месеца Търсачката на Microsoft увеличава степента на оцеляване при

Нестатистиката за юни 2016 г. е новината, че учените от Microsoft могат да използват търсачката „Bing“ за откриване на рак на панкреаса и това ще спаси човешки живот.

статистика

Това ранно откриване може да "увеличи 5-годишната степен на оцеляване на пациента от 3 процента на 5 до 7 процента", пише New York Times. Учените от Microsoft (Journal of Oncology Practice) са търсили търсенията на 6,4 милиона потребители за симптоми като необяснима загуба на тегло и за рискови фактори като алкохолна зависимост. От модела на запитванията е направен опит да се предскажат онези потребители, които по-късно очевидно са се разболели от рак, което се извежда от запитвания като „Защо получих рак на панкреаса?“. Süddeutsche Zeitung съобщава в своето онлайн издание на 9 юни под заглавие „Диагностика на рака от търсачката“: „В 5 до 15 процента от случаите те успяха да открият рано. По-впечатляващото е много малкият брой фалшиви положителни резултати. По-малко от един от 10 000 потребители е погрешно класифициран като рак. "

Както сега е обичайно, хората не бяха попитани дали личните им данни могат да бъдат анализирани. Но какво, ако степента на оцеляване се удвои? В крайна сметка е доказано, че Бинг спасява животи. Наистина?
Не. В крайна сметка, увеличаването на 5-годишния процент на оцеляване не казва нищо за това дали ранното откриване спасява животи. Не е трудно да се разбере. Помислете за 100 души, които всички умират от инвазивен рак до 70-годишна възраст. Ако те не се скринират, ракът ще бъде открит късно и 5-годишната степен на оцеляване е ниска. Ако отидат на скрининг, ракът ще бъде открит по-рано и 5-годишната степен на оцеляване ще се увеличи. В този пример никой не живее по-дълго, просто по-дълго с диагнозата. Съответно проучванията показват, че по-високите нива на преживяемост след скрининга не са свързани с по-ниска смъртност. Трикът с нивата на оцеляване не е нов. В нестатистиката от октомври 2014 г. показахме как може да се използва за заблуждаване на жените относно ползите от скрининга за рак на гърдата. Сега те се опитват да ни убедят в предимствата на големите данни.

Но какво ще кажете за малкия фалшив положителен процент от 1 на 10 000, подчертан от медиите? Означава ли това, че сред онези потребители, които алгоритъмът оценява като положителни, грешки почти никога не възникват? Не. Това също е лесно да се обясни. Нека вземем 100 000 потребители, 10 от които имат неоткрит рак на панкреаса. Със степента на откриване от 10 процента (средната стойност от 5 и 15 процента) очакваме, че само един от тези 10 ще бъде класифициран като положителен, а останалите 9 ракови заболявания ще бъдат пренебрегнати. От 99 990 потребители, които нямат рак, очакваме, че 10 все пак ще бъдат оценени положително (фалшиво положителен процент от 1 на 10 000). Тоест, от общо 11 души с положителен резултат, един има рак на панкреаса, а 10 нямат. Повечето от тези, които имат положителен тест, погрешно се класифицират като болни от рак. Така че дори ако нивото на фалшиво положително положително е ниско, делът на фалшивите положителни резултати във всички положителни резултати все още може да бъде висок при редки заболявания като рак на панкреаса.

Спомняте ли си Google Flu Trends? Подобно на Bing, тази програма е създадена, за да предскаже разпространението на грипа въз основа на търсенията. Той беше провъзгласен през 2009 г. с фанфари като отличен пример за успеха на големите данни. Сега е погребан без фанфари след години на прогнози, че е бил твърде висок. Дали д-р Google или Dr. Bing: Големите данни са преди всичко голям бизнес и не е задължително по-добро медицинско обслужване.