Бета грешка в анализа на мощността (грешка 2
При изпълнение Тестове на хипотези слагаш един Нулева хипотеза и ги тествайте до определено ниво на значимост α, обикновено 5%. По този начин вероятността да отхвърлите вашата нулева хипотеза, макар и да се прилага, се определя на максимум 5%.

В допълнение към алфа грешката има и други влияещи променливи, които определят "качеството" на вашия тест:
- Грешка от тип 2 или бета грешка
- Размер на ефекта
- Размер на пробата
Вие изследвате обема на белите дробове на учениците. Знаете, че техният среден белодробен обем μ за височина 170 см е четири литра и има известна дисперсия. За да проверите дали състезателният спорт увеличава обема на белите дробове до 4,5 литра, първо взехте проба от 120. След това сте определили средно 4,4 литра. С това можете да приемете нормално разпределение за средното над централната гранична теорема.
Вашите хипотези са:
Разпределението за средната стойност е кафяво в графиката, а критичната област, в която извършвате грешка от тип 1, е маркирана в червено. Синята линия показва критичната стойност на вашия тест.
Можете да вземете тестово решение с помощта на вашата пробна променлива на графиката: Ако нулевата хипотеза не се отхвърля, ако е, се отхвърля.
Зелената крива е разпределението по-долу. Ако е вярно, се включва увеличената средна стойност и реализациите на средната проба се преразпределят. И тук са възможни екстремни стойности в краищата на разпределението. Графиката показва допълнителна възможност за грешка под формата на бета грешка: де факто увеличеният обем на белия дроб не може да бъде разпознат като такъв.
Бета грешката
Със своя със сигурност критична стойност размерът на бета грешката се определя като площта под функцията за зелено разпределение вляво от. Критичната стойност и по този начин разстоянието между критичната зона и зоната на приемане е показана на графиката със синята линия.
На графиката можете да видите, че намаляването на Алфа грешка изместване на критичната стойност надясно. Това директно увеличава бета грешката. И обратно, увеличаването на алфа грешката води до изместване на критичната стойност наляво и бета грешката се намалява.
Силата на статистическия тест
Под Мощност или мощ на теста човек разбира вероятността всъщност да отхвърли фактически невярна нулева хипотеза, т.е. да не прави бета грешка. В примера това означава определяне на действително увеличения обем на белия дроб в теста. Разбира се, тестът на ниво α е колкото по-мощен и колкото по-добър, толкова по-малка е свързаната грешка.
Въпреки че можете да зададете алфа грешката на тест по желание, бета грешката не може да бъде контролирана директно. Но освен от размера на α, това зависи пряко от ефекта, който трябва да се провери, и от размера на пробата.
Ефектът
Под ефект човек разбира разликата между двете възможни средни стойности. Колкото по-голям е ефектът, който трябва да се тества, толкова по-лесно е да се разграничат хипотезите една от друга. Колкото по-далеч са върховете на разпределенията, толкова по-малко са областите на припокриване. Графично зелената функция се измества надясно с увеличаване на ефекта. Тъй като критичната стойност остава на мястото си, площта под зелената функция вляво от критичната стойност става по-малка.
Влияние на размера на извадката
Абсолютният размер на ефекта на вашия тест обикновено се дава от гледна точка на съдържанието и методически не е променлив. Тъй като обаче вземате тестовото решение с помощта на стандартизирани стойности, стандартизираният ефект може да бъде определен от Размер на пробата варират. Колкото по-голяма изберете пробата си, толкова по-малка е дисперсията на средната стойност, толкова по-голям е стандартизираният ефект и колкото по-надясно се измества зелената функция:
За горния случай сте дали ефекта, както и дисперсията с .
Таблицата показва влиянието на размера на извадката върху стандартизирания ефект:
| n = 120 | 0,183 | 2.732 |
| n = 500 | 0,089 | 5.618 |
| n = 1000 | 0,063 | 7 937 |
Във втората графика можете да видите как мощността на теста се увеличава с увеличаване на n, тъй като кривата отдолу се измества надясно: за n = 120 бета грешката, тъй като площта под жълтата крива до точката на пресичане с е относително голяма; за n = 1000 като площта под синята крива до точката на пресичане с ясно по-малка и за n = 5000 пренебрежимо малка.
За дадена алфа и даден ефект можете да повлияете на бета грешката, като изберете размера на извадката, така че да не надвишава желаното ниво на грешка. Като цяло се прилага следното: колкото по-голям е ефектът, който искате да тествате, толкова по-лесно е да го разпознаете и по-малък можете да изберете размера на извадката.
С други думи: колкото по-голяма е пробата, толкова по-малка е дисперсията на средната проба и толкова по-голям е стандартизираният ефект. Увеличаването на извадката обаче винаги е свързано с допълнителни усилия и увеличени разходи.
Анализ на мощността
The Анализ на мощността изследва взаимодействието на алфа и бета грешките, ефекта и размера на извадката. Обикновено бета грешката се избира четири пъти по-голяма от алфа грешката, така че например една от 20% да е насочена към.
Преди да вземете пробата си, трябва да определите необходимия или оптимален размер на пробата, ако е възможно. Има мощни програмни инструменти, с които можете да извършите анализа на мощността за тези съображения. Например, безплатен инструмент е GPower.