Изчислете и разберете статистическата корелация - с пример
Публикувано на 5 април 2019 г. от Валери Бенинг. Актуализирано на 21 юли 2020 г.
Корелацията ни казва степента на връзка между две променливи.
Положителната корелация означава, че променливите се развиват в една и съща посока. Така че ако една променлива се увеличава, увеличава се и другата променлива. В случай на отрицателна корелация е точно обратното: увеличение на променлива 1 означава намаляване на променлива 2.
Забележка Корелацията винаги е ненасочена, т.е. тоест не се казва коя променлива причинява другата. По-скоро можем да използваме корелацията, за да заявим дали има връзка и колко силна е тя.
Съдържание
Правилно определяйте и интерпретирайте корелациите
Корелацията се посочва с коефициента на корелация. Това винаги приема стойност между -1 и +1.
Пример Искаме да определим връзката между ръста (променлива 1) и теглото (променлива 2) на хората.
- близо до числото 1 → силна положителна корелация,
z. Например високите хора имат по-голямо тегло. - близо до числото -1 → силна отрицателна корелация
z. Например високите хора са по-леки. - близо до числото 0 → Едва ли има връзка между променливите височина и тегло.
Таблицата ви дава преглед на развитието на двете променливи в зависимост от това дали те корелират положително или отрицателно.
| Положителна корелация | Променлива 1 се увеличава → Променлива 2 се увеличава | С увеличаване на размера нараства и теглото. |
| Променлива 1 намалява → Променлива 2 намалява | Ако размерът намалее, теглото също намалява. | |
| Променлива 2 се увеличава → Променлива 1 се увеличава | С увеличаване на теглото се увеличава и размерът. | |
| Променлива 2 намалява → Променлива 1 намалява | Ако теглото падне, намалява и размерът. | |
| Отрицателна корелация | Променлива 1 се увеличава → променлива 2 намалява | Ако размерът се увеличи, теглото намалява. |
| Променлива 1 намалява → променлива 2 се увеличава | Ако размерът намалее, теглото се увеличава. | |
| Променлива 2 се увеличава → променлива 1 намалява | Ако теглото се увеличи, размерът намалява. | |
| Променлива 2 намалява → променлива 1 се увеличава | Ако теглото намалее, размерът се увеличава. |
Изчислете корелацията - Pearson или Spearman?
За да се изчисли и посочи корелацията, се определя коефициентът на корелация. От мащаба на данните зависи кой коефициент на корелация е правилният.
Използвайте коефициента на корелация на Пиърсън, ако вашите данни са метрични и коефициента на корелация на ранга на Спиърман, ако имате редови данни.
Забележка За номинално мащабирани данни определяме коефициента на непредвиденост, за да посочим връзката между две променливи.
Какъв е вашият резултат?
Разберете в рамките на 10 минути, дали сте създали неволно плагиатство.
- 70+ милиарда интернет източници
- 69+ милиона публикации
- Сигурна защита на данните

Интерпретирайте корелацията с разпръснатия график
В допълнение към изчисляването на коефициента на корелация можете да създадете разпръснат график. Това илюстрира връзката между двете променливи.
Илюстрацията показва разпръснатия график за нашия пример с ръста и теглото на хората. Виждаме, че има положителна корелация, защото разпределението на наблюденията (точките) е по-скоро като линия.
Така че променливите се движат в една и съща посока и можем да заключим, че по-големият размер върви ръка за ръка с по-голямо тегло.
Забележка Ако разпределението на наблюденията изглежда по-скоро като линия, това показва по-силна връзка между двете променливи и по този начин по-висок коефициент на корелация (r-стойност), отколкото ако наблюденията са широко разпръснати.
Разпръснат парцел в SPSS, Excel и Google Sheets
Използвайте следните стъпки, за да създадете разпръснат парцел с помощта на SPSS, Excel и Google Sheets:
| Графика → Създаване на диаграма → Scatter/point diagram |
| Вмъкване → Диаграма → Точка (X, Y) или диаграма на разсейване |
Корелация и причинност
При определяне на корелацията е важно да се отбележи, че корелацията е индикация, но не и доказателство за причинно-следствена връзка.
Това показва примерът с наблюдението на щъркелите и раждаемостта:
Ако наблюдаваме увеличен брой щъркели и също така по-висока раждаемост в региона, можем да кажем, че има корелация, но не и че има причинно-следствена връзка (напр. Че щъркелът носи бебетата).
Ако искате да разберете дали има причинно-следствена връзка, трябва да направите експериментално изследване или регресионен анализ с множество контролни променливи.
често задавани въпроси
Корелацията ни казва степента на връзка между две променливи.
Използвайте коефициента на корелация на Пиърсън за метрични данни и коефициента на корелация на ранга на Спирман за редови данни, за които определяте корелация.
Не, корелацията е индикация, но не и доказателство за причинно-следствена връзка между две променливи.