Кой статистически тест трябва да избера Crash Course Statistics
Прости обяснения, примери и изпитни задачи
Тази статия се основава на общата статия за „Как да тестваме хипотеза“. Препоръчвам да прочетете и разберете тази статия предварително; това прави потока на четене и разбиране на тази статия много по-лесен.
Таблицата за избор на тест
Следващата таблица (кликнете върху нея за по-голяма снимка) ви показва кой е най-подходящият тест за определено ниво на мащаба на целта и влияещи променливи. ->
Обяснението за това можете да намерите в останалата част на тази статия. В самия край има няколко примерни упражнения, които демонстрират как да използвате тази таблица.

Първо определете типа на вашата целева променлива, след това вида на вашата влияеща променлива. След това в тази таблица ще намерите подходящия метод за анализ на вашите данни.
Бързо предупреждение: В много ситуации изборът на правилния тест е много лесен и на практика има само един вариант. В някои случаи обаче има няколко подходящи теста, които могат да бъдат използвани. Ако напр. Ако има два възможни теста, тогава може би единият има предимството, че трябва да прави по-малко предположения за данните (напр. Нормално разпределение), а другият ще има предимството, че може по-добре да разпознае действително съществуващ ефект.
В тази таблица съм събрал тестове, които според мен са или най-простото, или най-доброто решение за определен набор от данни - важно е да се има предвид, че това не означава, че други тестове автоматично са грешни или по-лоши.
Обяснението на таблицата
Съществуват редица тестови процедури, които на пръв поглед могат да изглеждат поразителни. Точният тест, който ще бъде избран в конкретна ситуация, зависи от редица въпроси, на които трябва да се отговори отново във всяка ситуация.
Търсенето на изображения в Google за „кой статистически тест“ или „кой статистически тест“ предоставя много различни диаграми, които са с различни детайли и започват по различен начин. Някои са целенасочени, т.е. първият въпрос е „Какво искам да постигна?“ и възможните цели са напр. „Сравнете средно с хипотетична стойност“. Други диаграми се основават на свойствата на данните. Тук започвате с въпроса "Каква е целевата променлива?" е номинално или непрекъснато. Според мен с това е по-лесно да започнем, поради което си задаваме следните два въпроса:
1.) Какъв вид е целевият размер? -->
Целевата променлива е характеристиката, която ще се промени поради ефекта от влиянието на променливите. Зависи от влияещите фактори. Бих искал напр. докажете антихипертензивния ефект на ново лекарство, тогава целевата ми променлива е кръвното налягане, а влияещата променлива е лекарството (напр. бихте имали две групи, един човек без лекарство и един човек с лекарство).
Сега определете от кой тип (кое ниво на мащаба) е вашият целеви размер:
2.) Какви са влияещите фактори?
--> Второ, трябва да определим дали изобщо имаме влияеща променлива и ако да, какъв тип скала има.
Важно: При влияещите променливи няма значение какво разпределение имат. Така че дали дадена въздействаща променлива обикновено се разпределя или не е без значение за тестовата процедура.
задачи
За всеки от следните случаи определете кой тест е подходящ за всеки отделен случай. Първо идентифицирайте целевия размер и определете неговия тип (номинален, редови и др.). След това определете дали има една или повече влияещи променливи и какъв тип са те. След това използвайте таблицата, за да намерите подходящия тест.
(Освен ако това не е специално отбелязано в упражнението, не можете да приемете нормално разпределение на променливите.)
- 1а) Целевата стойност тук е броят на цигарите на ден. Това са данни за преброяване, така че целевият размер обикновено се мащабира (можете също да го считате за интервално мащабиран). Влияещият фактор е моментът във времето (преди/след), т.е.номинална променлива с две групи. Двете групи са сдвоени, тъй като измерванията са свързани: едни и същи хора са били интервюирани преди и след терапията. Според таблицата, подходящият тест е тук Уилкоксън подписа ранг тест.
- 1б) В сравнение с 1а), единственото нещо, което се променя тук, е фактът, че влияещата променлива вече няма само две, а няколко групи. Според таблицата сега използваме Тест на Фридман.
- 2а) Тук искате да тествате проста част. Има номинален резултат от две групи и няма предиктор. Ето един Биномиален тест правилната.
- 2б) Сега все още няма влияеща променлива, но целевата променлива вече има няколко групи. Тук използвате един Тест за добро състояние на пригодност на хи-квадрат.
- 3а) Тук имате номинална целева променлива с две категории и няколко влияещи променливи, непрекъснати и категорични. A логистична регресия е подходящо тук.
- 3б) Резултатът е непрекъснат, но обикновено не се разпределя. Влияещият фактор е категоричен с две групи. Тъй като двете групи (мъже и жени) не са сдвоени (какъвто би бил случаят с преди/след групи, например), най-добре е да вземете една тук У-тест на Уилкоксън-Ман-Уитни.
- 3в) Ако има повече от две групи, използвайте вместо теста на Wilcoxon-Mann-Whitney U Тест на Крускал-Уолис.
- 4) С две непрекъснати или нормално разпределени променливи може да се изчисли корелацията между тях и Тест за корелация на Пиърсън изпълнявам. Като алтернатива също би било възможно линеен модел (т.е. линейна регресия).
- 5) Резултатът обикновено се разпределя и влияещият фактор е категоричен с две групи. Вписва се тук Т-тест с две проби.
- 6) Целевата променлива е избраната страна, т.е.категорична променлива с няколко групи. Влияещият фактор, образователната квалификация, също е категоричен. Затова се вписва тук Тест хи-квадрат. The Тест на Фишър също е алтернатива. Използва се в случаи с по-малко данни, напр. ако има по-малко от 1000 наблюдения или ако поне една от клетките в кръстосаната таблица има по-малко от 5 наблюдения.
- 7а) Тук се изследва влиянието на категорично влияеща променлива върху нормално разпределена целева променлива. A АНОВА е правилният инструмент за това, алтернатива също би била възможна модел на линейна регресия.
- 7б) Ако има няколко влияещи фактора, един се обръща към множествена линейна регресия навън.
- 8а) Тук се тества ординална целева променлива (без влияние върху променливите) върху медианата. A Тест за подписване може да тества това.
- 8б) Целевата променлива все още е подредба, но сега има постоянна въздействаща променлива. Може да се изчисли корелацията на ранга на Спирман на тези две променливи и след това Тест за копие тичам за тест за корелация.
- 9а) Това е категорична целева променлива с две групи (високо кръвно налягане да/не). Влияещата променлива също има две групи и тя е сдвоена, тъй като едни и същи хора се измерват в групата „преди“ и „след“. Така че има Тест на Макнемар в.
- 9б) Ако целевият размер обикновено се разпределя вместо категоричен, вие ръководите такъв сдвоен t тест навън.
3 мисли за „кой статистически тест да избера? "
Объркан съм от примера ви с постоянни влияещи променливи или задача 1: „Брой обаждания до разпределително табло“ и „цигари на ден“ са дискретни стойности, защо те се появяват тук като непрекъснати или редови?