Информатика Тема 9 за определяне
Тема № 9. Електронни таблици Microsoft Office Excel 2007: методи за статистическа обработка на данни.
Целта на урока: изучаване на методи за статистическа обработка на данни, определяне на основните статистически числени характеристики на предложеното разпределение, разкриване на надеждността на разликите между две извадки, определяне на коефициента на корелация.
Оборудване: компютър с операционна система Windows, оборудван с офис пакет от приложения на Microsoft Office 2007, химикалка, насоки за преподаване на урока, книга с лекции.
Кратък теоретичен курс по темата на урока:
За да се получат експериментални данни, е необходимо да се направи проучване на съответните обекти. Комплектът, който включва всички изследвани обекти, се нарича общ. Общото население се формира например от всички пациенти с тази диагноза, всички новородени деца и т.н. Общата сума на членовете на генералното население се нарича негов обем и се обозначава с буквата N. Теоретично обемът на генералната съвкупност не е ограничен с нищо (N). Следователно, част от обектите от генералната съвкупност обикновено се изучава - извадка. Размерът на извадката ще бъде обозначен с буквата n.
Количествените характеристики на извадковите обекти се характеризират с числено разпределение. Числените разпределения могат да се различават значително един от друг. Те могат да имат различни средни стойности на случайната променлива или да се различават в дисперсията на данните от наблюдението около посочените стойности. Следователно, за по-нататъшно проучване на промяната в стойностите на произволна променлива на която и да е характеристика на даден обект, се използват числени характеристики на разпределения или вариационни серии. Те обикновено се наричат статистически-
характеристики или оценки. Оценката може да бъде точка или интервал .
Точковата статистическа оценка е примерна характеристика, която е число, което се използва като приблизителна стойност на неизвестна обща характеристика.
Интервалът е оценка, която се определя от две числа - краищата на интервала, обхващащи прогнозния параметър.
За описване на числени разпределения (примерни и общи) се използват следните характеристики на разпределенията: средна стойност, дисперсия, стандартно отклонение (или стандартно отклонение SD).
Една от основните области на приложение на статистическите методи в медицината е да обоснове заключенията, произтичащи от сравнението на статистическите показатели. Основният въпрос в този случай е преценката за степента, до която установената в проучването разлика между два примерни показателя (например: средни стойности) може да показва значителна, неслучайна разлика между общите популации. В областта на биометрията се използват два вида статистически критерии: параметрични, изградени въз основа на параметрите на даден набор и представляващи функции на тези параметри, и непараметрични, които са функции, които зависят пряко от варианта на даден набор с техните честоти. Един от параметричните методи е методът на Student, който се използва за сравнителна оценка на средните стойности.
За да се опише връзката между променливите, се използва математическата концепция на функцията f, ако всяка конкретна стойност на независимата променлива x (аргумент) съответства на единична стойност на зависимата променлива y (функция): y = f (x). В биологията и медицината често се налага да се справяме с различна връзка между признаците, когато редица различни стойности на друга черта съответстват на същата стойност, което се дължи на разнообразието от взаимодействия между различни явления на живата природа. Тази връзка се нарича корелация. Степента на връзка между явленията се оценява с помощта на коефициента на корелация r и може да бъде слаба, умерена, силна, пълна или отсъстваща.