Модели на структурни уравнения - Статистика Wiki Ratgeber Lexikon

Общо въведение

Когато изследват емпирични факти, психолози, биолози, статистици и т.н. търсят връзки между различни променливи. Тези променливи могат да бъдат моделирани с помощта на измерими (наблюдаеми), както и латентни (ненаблюдаеми) променливи. Метод, който често се използва, е линейна регресия.С този метод записвате линейната връзка между изследваните измерими променливи. Не получавате никаква информация за причината и следствието (причинно-следствената връзка) между вашите променливи. Освен това сложните връзки между вашите променливи могат да останат неоткрити.

Моделът на структурното уравнение може да реши тези две точки. По-специално, той може да ви даде представа за „скритите“ структури на вашите променливи (оттук и името). Методът е комбинация от факторен анализ, линейна регресия и анализ на траекторията. В литературата терминът „модел на структурно уравнение“ се използва за различни, но по същество сходни методи. Както при повечето методи за статистически анализ, вие също трябва да формирате хипотези и след това да ги тествате за значимост. Можете също да използвате факторния анализ, за да дефинирате латентни променливи.

Модел на структурно уравнение на практика

Да предположим, че правите следната хипотеза:

Стресът и тежката физическа работа влошават здравето на човека.

Както можете да видите, съществува причинно-следствена връзка между екзогенните латентни променливи стрес и физическа работа и ендогенния, латентен променлив здравен статус. С помощта на модел на структурно уравнение можете да търсите структурата в контекста на вашите променливи. За да направите това, имате нужда от измерими променливи, за да уловите скритите променливи. В този пример можете да измервате стреса, например по време на сън и загуба на тегло. Можете да измервате физическата работа по изгорените калории и броя на случаите на изтощение. Можете напр. чрез измерване на нивата на кръвната захар и кръвното налягане. Графичното представяне под формата на диаграма на пътя е много полезно, за да можете да следите вашия модел. Следващата диаграма на пътя илюстрира това

Графично представяне на модела от горния пример, използващ диаграма на пътя.

Моделът на структурното уравнение от горния пример. Можете да разпознаете измеримите променливи като жълти квадрати, а скритите променливи като сини овали. Очертан е структурният модел. Прекъснатите стрелки представляват структурата, която ви интересува. Вашата хипотеза е математически:

Параметрите на модела и се различават значително от 0.

Параметрите както, така и и са измеримите параметри и могат напр. може да се определи чрез факторния анализ. След определяне на параметрите можете да актуализирате съответно диаграмата на пътя. Като алтернатива на горната хипотеза можете да оцените скритите променливи, т.е. структурата на модела, като използвате фактор или анализ на дисперсията.

Как оценявате параметрите?

Следващият пример ви показва как се определят латентните променливи и се изчисляват параметрите. На фигурата по-долу можете да намерите разпръснат график от два фиктивни набора от данни за времето за сън и загуба на тегло с по 200 стойности. Всеки от времевите редове беше центриран около 0 (чрез изваждане на средната стойност на стойностите от всяка стойност). За да остане в примера по-горе, латентното променливо напрежение трябва да се определи с помощта на факторния анализ. Както можете да видите на фигурата, разпространението на данни, т.е. дисперсията на данните, е по различни линии

променлива	параметър	стойност
Лягане	c1	0,3
Отслабване	c2	0.7

Таблица 1: Дисперсия на данните

променлива	Дисперсия
X1	0,97
X2	4.88
X1 ′	5.71
X2 ′	0,15

Таблица 2: Параметри за определяне на фактора

Линии за произход с различни размери. Сега искате да обясните дисперсията на променливия стрес с вашите измерими променливи до максимум и съответно търсите посоката с максималната дисперсия. Можете да направите това с няколко метода.

Добър и често използван метод е методът на главната ос (вж. Анализ на главните компоненти). Този метод определя правата линия през началото, т.е. първата основна ос, по която разсейването на данните е максимално. След това можете да определите втората основна ос. Това има най-голяма дисперсия на данните сред всички прави линии през начало, които са перпендикулярни на първата основна ос. Продължавате по подобен начин, когато определяте допълнителни основни оси. Можете да си представите метода като промяна в цялата координатна система.

За настоящите данни двата основни компонента са показани като двете кръстосани линии X1 'и X2' на фигурата. Дисперсиите в данните могат да бъдат намерени в таблица 1. Дисперсията по оригиналните координати (плътни X1 и X2) е по-малка от дисперсията по първата основна ос X1 'и по-голяма от дисперсията по втората основна ос X2'. След това можете да видите тази нова променлива X1 ’като фактор 1, т.е. латентното напрежение на променливата.

С този метод не само получавате дисперсиите, но и параметрите и излизате. Резултатите за това можете да намерите в таблица 2. Можете да изчислите стойностите на латентното променливо напрежение, обяснено от измеримите променливи, със следното уравнение (съкратени имена на променливи):

Така че обяснявате дисперсията на данните по първия основен компонент X1 'от 5.71. Дисперсията по втория основен компонент X2 'от 0,15 е необяснимата дисперсия, което е 2,6% от обяснения вариант.

След като сте определили всичките си скрити променливи, можете да оцените параметрите и например с линейна регресия. Съответното уравнение е, когато за физическа работа стои:

В това уравнение вариацията на променливата здраве не се обяснява с променливите в уравнението. Най-лесният начин за определяне на параметрите на регресията и с помощта на статистически софтуер. Повечето програми предоставят както прогнозните стойности, така и значимостта на оценката. В таблицата по-долу можете да намерите примерна оценка за фиктивни стойности на данните. Резултатът може да изглежда така, например:

променлива	Прогнозна стойност	t-Статистика	р-стойност
постоянна	0,04	0,59	0,55543
стрес	0,89	12.26	4.10E-25
Работа	-0,64	-9.30	2.78E-13

Методът

1. Формулиране на въпроса (хипотеза): В този момент трябва да помислите добре кой конкретен въпрос искате да преследвате. Това е централният аспект на вашия модел, тоест неговата структура.

2. Избор на измерими променливи и диаграма на пътя: За да проверите емпирично вашите хипотези, трябва да изберете измеримите променливи. Те едновременно трябва да потвърдят вашата хипотеза и да бъдат представителни. След това показвате целия модел графично с помощта на диаграма на пътя (както по-горе).

3. Разпознайте структурата на модела: Използвайки вашата диаграма на пътя, вие разпознавате предполагаемите или очакваните връзки. По-специално, това ви дава добър преглед, който можете бързо да загубите с няколко променливи.

4. Оценка на параметрите и тест за значимост: Оценките на параметрите в модела на структурното уравнение могат да варират. Най-често срещаните методи са линейна регресия и факторен анализ или анализ на главните компоненти, както можете да видите в горния пример. На практика за това се използват програми, които извършват всички необходими стъпки за изчислението. Важни софтуерни пакети за това са например SPSS Amos, Mplus или SmartPLS.

5. Възможни промени в модела: Можете да отхвърлите параметрите, които не се различават значително от 0. След това премахвате съответните стрелки в диаграмата на пътя. Параметрите, които не са значими, трябва да се изхвърлят само веднъж. С поглед към актуализираната диаграма на пътя, можете да извършите оценката отново без изхвърлените параметри. В зависимост от крайния резултат можете да отхвърлите хипотезата си, да я запазите или да я преинтерпретирате.

литература

Jöreskog, K. G. & Sörbom, D. (1989). LISREL 7: Ръководство за програмата и приложенията (2-ро издание). Чикаго, Илинойс: SPSS