Статистика за манекени - страница 20

Фактори за размера на пробата
Погледнете формулата за граница на грешка за средната стойност на извадката и забележете, че знаменателят на тази дроб е n (това се отнася за почти всички
формули за ограничаване на грешките): Z × s. Когато n нараства, тогава n
се образува знаменателят на фракцията, поради което цялата дроб става по-малка. Следователно, грешката намалява и доверителният интервал става същият.
Б. !
Ако се интересувате от високо ниво на доверие, трябва да увеличите Z-стойността и следователно границите на грешка, в резултат на което доверителният интервал се разширява, което е лошо. Разширяването на доверителния интервал може да бъде компенсирано чрез увеличаване на размера на извадката и по този начин намаляване на допуснатата грешка, което ще доведе до стесняване на доверителния интервал. Увеличаването на размера на извадката ще ви позволи да поддържате необходимото ниво на доверие, като същевременно не разширявате доверителния интервал (който като цяло е необходим). Това може да се разбере още преди започване на проучването: ако знаете допуснатата грешка, която искате да получите, тогава можете предварително да определите необходимия размер на извадката (вж. Глава 9).
Ако използвате процент като статистика (например процентът на хората, които носят сандали през лятото), можете приблизително да изчислите грешката, като разделите 1 на квадратния корен от n (размер на извадката). Можете да изберете различни стойности на n и да видите как се променя границата на пробата.
Какъв е приблизителният размер на извадката, необходим за проучванията, за да се запази тесният интервал на доверие? Използвайки формулата от предишния параграф, можете бързо да сравните няколко неща. Проучване сред 100 души ще има грешка
= 0,10 или плюс/минус 10% (т.е. ширината на доверителния интервал с-
100 е 20%, което е доста). Но ако интервюирате 1000 души, тогава ограничението е неточно-
е значително намален и ще бъде равен на плюс/минус 3%, ширината на доверителния интервал вече е 6%. След анкетирането на 2500 души, грешката ще бъде плюс/минус 2% (което означава, че ширината ще намалее до 4%). Ако си представим колко голямо е цялото население (например населението на Съединените щати е над 280 милиона души!), Тогава това ще бъде доста малка извадка, която въпреки това ви позволява да получите точни резултати.
Не прекалявайте обаче с размера на извадката, защото в един момент ползата изчезва. Например, ако преминете от извадка от 2500 души към 5000, тогава интервалът на доверие се стеснява до около 2 × 1,4 = 2,8%. Всеки път, когато интервюирате друг човек, цената на анкетата се увеличава, което означава, че добавянето на още 2500 души към анкетата, само за да стесните интервала с малко повече от 1%, може да е неразумно.
Глава 12. Изчисляване на точни доверителни интервали

Точността на изчислението на резултатите зависи не само от размера на извадката, но също така
относно качеството на данните. Голяма извадка, която се характеризира с-
значително пристрастие (вж. глава 2), може да даде тесен интервал на доверие,
но в същото време това няма да означава абсолютно нищо. Това е като теб
състезавайте се в стрелба и равномерно стреляйте със стрели от лък, но всички
тъй като се оказва, че сте уцелили целта на съсед - толкова сте загубили
разбира се. Но в светлината на статистиката е невъзможно да се оцени пристрастието, можете само свещеници-
опитайте се да го сведете до минимум.
Колкото по-голям е размерът на извадката, толкова по-малка е грешката и толкова повече
интервалът на доверие ще стане, при условие че всичко останало остава
няма промени и качеството на данните ще бъде високо.
Ние вземаме предвид вариабилността на популацията