5. Изследване на връзката между променливите

5. Изследване на връзката между променливите

изследване

Съдържание Двуизмерна проба (разпръснат график) Анализ на тенденцията, линейна регресия Коефициент на определяне Значения на коефициента на корелация Z-трансформация на Фишер Модел на частичната корелация Стохастична монотонност

Време, прекарано в учене (часове/дни) Двуизмерна извадка Студент Време, прекарано в учене (часове/дни) Учебно средно 1. 2 3.0 2. 4 4.0 3. 4. 5. 1 3.5 6. 3 2.5 7 5 8. 5.0

Scatterplot (bivariate) 5 4 Средно проучване 3 2 1 2 3 4 5 Колко часа учиш на ден?

Положителна линейна връзка (I) 55 50 Дължина при раждане (см) 45 40 35 1 2 3 4 5 Тегло при раждане (кг)

Положителна линейна връзка (II) 145 140 135 Ядро на тялото. На възраст 10 130 125 120 115 20 25 30 35 40 45 Телесно тегло на възраст 10 години (кг)

Нелинейна (U-образна) връзка Y X -3 3

Независимост 1 80 Y Y 0,5 50 20 X 0,5 X 1 20 50 80

Връзка, връзка между две променливи (X и Y) Сътрудничество, съвместно движение, съвместна промяна на X-стойности и Y-стойности според някакво правило

Какво е правилото по отношение на следните две променливи? 55 50 Дължина при раждане (см) 45 40 35 1 2 3 4 5 Тегло при раждане (кг)

Каква полза от разкриването на такова правило? Разбираме нещо (теоретичен аспект) Можете да го използвате, за да направите изводи (практически аспект). Например, ако X е толкова, тогава Y е?

Прогноза с помощта на ред: ако X = 2, Y =? 55 50 Дължина при раждане (см) 45 40 35 1 2 3 4 X 5 Тегло при раждане (кг)

Регресионен проблем За да разберете правилото на връзката между променливата X и Y: как Y „зависи“ от X? Пристрастяването не е непременно причинно-следствено (напр. Може да се направи заключение от детето на родителя) Типът пристрастяване може да бъде няколко вида: напр. линейни или различни нелинейни (U-образни, експоненциални и др.)

Основни понятия за прогнозиране Прогнозирана (зависима) променлива: Y Прогнозна (предсказваща, независима) променлива: X Линейна прогноза (прогноза): Ŷ = a + bX Истинска Y-стойност за x: y Прогноза за x: ŷ = a + bx

Параметри на права y = a + bx 320 240  160 a 80 1 2 3 4 5 X ‘a’: Y-ос сечение ‘b’: коефициент на наклон: b = tg (

Характеристика на линейна връзка Не винаги права пропорционалност Същото количество промяна на X винаги се придружава от едно и също количество Y промяна.

Пример за променливи на линейна регресия: X: ThengthBirth, Y: Thength10 години Уравнение на регресията: Ŷ = 96,88 + 0,83X Заключение (прогноза за регресия): Например за X = 45cm: Ŷ = 96,88 + 0,83 · 45 = 134, 23 (cm) ЧЗВ

Грешка в оценката на регресията за един човек Ако прогнозната (прогнозна) телесна височина на човек на 10-годишна възраст е 151 cm (Ŷ), а истинската стойност е 146 cm (Y), тогава грешката е: Абсолютно отклонение: | 151-146 | = 5 cm Квадратно отклонение: (151-146) 2 = 52 = 25 cm2

Средна грешка в оценката на регресията: стандартна грешка Средно стандартно отклонение = Дисперсия на грешката = Res Грешка Стандартно отклонение = Корен (вариация на грешка) = Стандартна грешка (SH)

Var (Y) и Res средна стойност Var (Y): средно квадратично отклонение от средната стойност = вариация на грешката на средната оценка. (.) SH2 = Res: дисперсия на грешка при оценка на регресията. Колкото по-ниска е Var (Y) Res, толкова по-добра е оценката на регресията Намаляване на грешки: Var (Y) - Res Относително намаляване на грешката: (Var (Y) - Res)/Var (Y)

Примери Често задавани въпроси Променлива средна вариация Res SH RHCS X: ThosszBirth 50,2 6,4 Y: Thossz10 138,7 41,5 37,09 6,1 0,107 X: Майчино тяло 161,1 38,3 Y: Thossz10 138,7 41, Δ 36,02 6,0 0,132 X: Apatesth 173,4 46,0 Y: Thossz10 138,7 41,5 35,96 X: Тегло 10 33,2 46,4 Y: Thossz10 138,7 41, 5 23,33 4,8 0,438 ЧЗВ

Коефициент на определяне Относително намаляване на грешката = коефициент на определяне Обяснено коефициент на дисперсия Нотация: Det (X, Y)

Коефициентът на корелация Абсолютната стойност на коефициента на корелация е квадратният корен от коефициента на детерминация: Знакът на коефициента на корелация е равен на знака на коефициента на регресия на наклон (b): Положителна тенденция: +, отрицателна тенденция: -

Нотации на коефициента на корелация Нотация на популационния (теоретичен) коефициент на корелация: ρ (произнася се: Ró), ρxy, ρ (x, y) Нотация на коефициента на корелация в извадката (Pearson's): r, rxy, r (x, у)

Корелационна матрица (n = 500) Променливо тегло0 Тегло10 Tmag0 Tmag10 1 0,16 0,79 0,24 0,23 0,66 0,33