Изчислете и разберете статистическата корелация - с пример

Публикувано на 5 април 2019 г. от Валери Бенинг. Актуализирано на 21 юли 2020 г.

Корелацията ни казва степента на връзка между две променливи.

Положителната корелация означава, че променливите се развиват в една и съща посока. Така че ако една променлива се увеличава, увеличава се и другата променлива. В случай на отрицателна корелация е точно обратното: увеличение на променлива 1 означава намаляване на променлива 2.

Забележка Корелацията винаги е ненасочена, т.е. тоест не се казва коя променлива причинява другата. По-скоро можем да използваме корелацията, за да заявим дали има връзка и колко силна е тя.

Съдържание

Правилно определяйте и интерпретирайте корелациите

Корелацията се посочва с коефициента на корелация. Това винаги приема стойност между -1 и +1.

Пример Искаме да определим връзката между ръста (променлива 1) и теглото (променлива 2) на хората.

  • близо до числото 1 → силна положителна корелация,
    z. Например високите хора имат по-голямо тегло.
  • близо до числото -1 → силна отрицателна корелация
    z. Например високите хора са по-леки.
  • близо до числото 0 → Едва ли има връзка между променливите височина и тегло.

Таблицата ви дава преглед на развитието на двете променливи в зависимост от това дали те корелират положително или отрицателно.

Пример за развитие на корелацията на променливите
Положителна корелация Променлива 1 се увеличава → Променлива 2 се увеличава С увеличаване на размера нараства и теглото.
Променлива 1 намалява → Променлива 2 намалява Ако размерът намалее, теглото също намалява.
Променлива 2 се увеличава → Променлива 1 се увеличава С увеличаване на теглото се увеличава и размерът.
Променлива 2 намалява → Променлива 1 намалява Ако теглото падне, намалява и размерът.
Отрицателна корелация Променлива 1 се увеличава → променлива 2 намалява Ако размерът се увеличи, теглото намалява.
Променлива 1 намалява → променлива 2 се увеличава Ако размерът намалее, теглото се увеличава.
Променлива 2 се увеличава → променлива 1 намалява Ако теглото се увеличи, размерът намалява.
Променлива 2 намалява → променлива 1 се увеличава Ако теглото намалее, размерът се увеличава.
Забележка Ако искате да направите изявления за посоката на връзката или ако имате зависима и независима променлива, можете да използвате регресионен анализ.

Изчислете корелацията - Pearson или Spearman?

За да се изчисли и посочи корелацията, се определя коефициентът на корелация. От мащаба на данните зависи кой коефициент на корелация е правилният.

Използвайте коефициента на корелация на Пиърсън, ако вашите данни са метрични и коефициента на корелация на ранга на Спиърман, ако имате редови данни.

Забележка За номинално мащабирани данни определяме коефициента на непредвиденост, за да посочим връзката между две променливи.

Какъв е вашият резултат?

Разберете в рамките на 10 минути, дали сте създали неволно плагиатство.

  • 70+ милиарда интернет източници
  • 69+ милиона публикации
  • Сигурна защита на данните

разберете

Интерпретирайте корелацията с разпръснатия график

В допълнение към изчисляването на коефициента на корелация можете да създадете разпръснат график. Това илюстрира връзката между двете променливи.

Илюстрацията показва разпръснатия график за нашия пример с ръста и теглото на хората. Виждаме, че има положителна корелация, защото разпределението на наблюденията (точките) е по-скоро като линия.

Така че променливите се движат в една и съща посока и можем да заключим, че по-големият размер върви ръка за ръка с по-голямо тегло.

Забележка Ако разпределението на наблюденията изглежда по-скоро като линия, това показва по-силна връзка между двете променливи и по този начин по-висок коефициент на корелация (r-стойност), отколкото ако наблюденията са широко разпръснати.

Разпръснат парцел в SPSS, Excel и Google Sheets

Използвайте следните стъпки, за да създадете разпръснат парцел с помощта на SPSS, Excel и Google Sheets:

SPSS Excel
Google Таблици
Графика → Създаване на диаграма → Scatter/point diagram
Вмъкване → Диаграма → Точка (X, Y) или диаграма на разсейване

Корелация и причинност

При определяне на корелацията е важно да се отбележи, че корелацията е индикация, но не и доказателство за причинно-следствена връзка.

Това показва примерът с наблюдението на щъркелите и раждаемостта:

Ако наблюдаваме увеличен брой щъркели и също така по-висока раждаемост в региона, можем да кажем, че има корелация, но не и че има причинно-следствена връзка (напр. Че щъркелът носи бебетата).

Ако искате да разберете дали има причинно-следствена връзка, трябва да направите експериментално изследване или регресионен анализ с множество контролни променливи.

често задавани въпроси

Корелацията ни казва степента на връзка между две променливи.

Използвайте коефициента на корелация на Пиърсън за метрични данни и коефициента на корелация на ранга на Спирман за редови данни, за които определяте корелация.

Не, корелацията е индикация, но не и доказателство за причинно-следствена връзка между две променливи.