Многовариантни статистически методи за анализ на данни в проблемите на приложните изследвания 5 1 основни
Глава 5. МНОГОИЗМЕРНИ СТАТИСТИЧЕСКИ МЕТОДИ ЗА АНАЛИЗ НА ДАННИТЕ В ПРОБЛЕМИТЕ НА ПРИЛОЖЕНИТЕ ИЗСЛЕДВАНИЯ
5.1. Основните разпоредби на факторния анализ
От началото на XX век. интензивно разработване на специална област на статистическите изследвания, наречена факторен анализ. Развитието на тази посока започва в психологията и по инициатива на психолози. Авторите на основните концепции за факторния анализ са предимно американски и английски учени (C. Spearman, L. L. Thurstone, G. H. Thomson, S. L. Barth, R.B. Cattell).
Основното предположение за факторния анализ може да бъде формулирано по следния начин: явления в определена област на изследване, въпреки тяхната хетерогенност и вариабилностността, може да се опише с относително малък брой функционални единици, параметри или фактори. Факторният анализ не признава произволни решения относно важността на определени променливи за дадена област на изследване. Освен това той не се ограничава до твърдението, че промяната в една променлива е свързана или не е свързана с промяната в друга, а отива по-далеч, опитвайки се да определи мярката на тази връзка. В този случай най-важното е, че той не се ограничава до сравняване на промените, лежащи на повърхността на явленията, а се стреми да открие основните влияния, залегнали в основата на тези промени [21].
Изследването започва със събиране на наблюдения за вариацията на набор от променливи. След това се изчисляват всички възможни корелации между наблюдаваните променливи, за да се определи дали има връзка между тях и каква е нейната мярка. Използвайки корелационен анализ, изследователят се опитва да идентифицира връзката на изследваните характеристики, което от своя страна му дава възможност да избере пълен и излишен набор от характеристики чрез комбиниране на силно корелирани характеристики.
Въз основа на получените коефициенти на корелация се извършва факторен анализ, който ни позволява да идентифицираме нови латентни променливи, които са линейни комбинации от предишните и предават по-голямата част от информацията, съдържаща се в първоначалните наблюдения.
Във всеки случай трябва да осъзнаете, че, от една страна, имаме работа с определена концепция, която се стреми да обясни намерените корелации с помощта на общи фактори, а от друга страна е необходимо да се вземе предвид, че възможностите за достатъчно точен и недвусмислен подбор на тези фактори с помощта на математиката са ограничени.
Когато решава проблеми с факторния анализ, изследователят обикновено прави три стъпки. Те могат да бъдат описани като:
изготвяне на съответната корелационна матрица;
подчертаване на първоначалните (ортогонални) фактори;
въртене на матрицата на началните фактори, за да се получи окончателното решение.
Основният модел на факторния анализ е написан в следната система от равенства [13]:



Тоест се приема, че стойностите на всяка характеристика хi може да се изрази като сбор от прости фактори еj, броят на които е по-малък от броя на оригиналните елементи, а останалата част i с отклонение 2 (i) действа само на хi, което се нарича специфичен фактор.
Коефициенти лij са наречени натоварване i-та променлива на j-th коефициент или товар j-th фактор на i-та променлива. В най-простия модел на факторния анализ се приема, че факторите еi са взаимно независими и техните дисперсии са равни на единица, а случайните променливи аз също съм независим един от друг и от всеки фактор еj . Максимално възможен брой фактори м за даден брой функции стр се определя от неравенството
, (5.2)
което трябва да се изпълни, така че задачата да не се изроди в тривиална. Това неравенство се получава чрез изчисляване на степента на свобода, налична в задачата [17].
Извиква се сумата на квадратите на натоварванията в израз (5.1) общност съответстваща характеристика хi, и колкото по-голяма е тази стойност, толкова по-добре е описана характеристиката хi фактори еj. Общото е част от дисперсията на черта, която факторите обясняват. На свой ред,
