Основи на статистиката Каква е разликата между дискретни и непрекъснати характеристики - и кога са те

Основи на статистиката: Каква е разликата между дискретни и непрекъснати характеристики - и кога могат да се натрупват характеристики?

Като част от уводна статистическа лекция, човек обикновено се занимава с важния въпрос кои свойства могат да бъдат използвани за категоризиране на статистически характеристики или променливи. По-голямата част от времето се обсъжда разграничението между акумулативни и некумулативни характеристики, както и непрекъснати и дискретни характеристики, което следователно е и предмет на днешната статия в блога.

статистиката

Кумулативни и некумулативни характеристики

Характеристика се счита за натрупваща, ако може да приеме няколко форми по отношение на една и съща статистическа единица. Такъв е случаят при лично проучване, например с характеристики като хоби или професионално обучение, тъй като е напълно правдоподобно, че изпитваното лице може да се занимава с много различни хобита или дори да е завършило няколко професионални обучения. Така че може да има един или повече валидни отговора на въпрос. Други характеристики като годината на раждане или (биологичния) пол, от друга страна, трябва да се считат за некумулативни, тъй като може да има само една правилна информация за субект.

На практика въпросът дали данните могат да се натрупват е от голямо значение, когато данните, събрани чрез въпросници, трябва да бъдат преобразувани в структура на таблица. Ако при създаването на таблицата човек пренебрегва факта, че характеристиката може да приеме няколко форми и това се забелязва само при въвеждане на n-тия запис на данни, може да се наложи таблицата да бъде напълно пресъздадена и с въвеждането на данните - поне частично - започнете отначало. Следователно, за да се избегне нервна драма, струва си да направите пауза за момент, преди да въведете данните, събрани на компютъра - също поради други причини - и да помислите коя структура на таблицата е подходяща за данните.

Дискретни и непрекъснати функции

Прости истини за сложен свят

Една характеристика се счита за дискретна, ако може да приеме само преброим брой форми. На практика това обикновено означава, че броят на възможните изрази е краен. Такъв е случаят например с училищни оценки, година на раждане, цвят на косата, пол или брой участници в дадено събитие - във всички тези случаи броят на възможните стойности е краен и обикновено може дори да бъде напълно ограничен предварително (например училищни оценки от 1 до 6, брой участници между 0 и максимум 10 000 и т.н. стр.). В много учебници, освен „преброими много изрази“ с „преброими безкрайно много изрази“, се дава и второ определение за отделните характеристики, което на пръв поглед изглежда малко объркващо - в крайна сметка може да се мисли, че даден набор е или безкраен, или един може да ги преброи.

Това, което се разбира под това обаче, е, че множество A е безкрайно подмножество на (също безкрайния) набор от естествени числа N, елементите на които могат да бъдат преброени. Множеството от прости числа е например броячно безкрайно множество, защото въпреки че има безкрайно много прости числа, то е по-малко от множеството от естествени числа (не всяко число е просто число) и можете да преброите елементите му: Първото просто число е 2, второто 3, третото 5 - и така нататък и така нататък ... Формално правилната дефиниция на израза „брояемо безкрайно“ („В теорията на множествата множество А се нарича брояемо безкрайно, ако има същата мощност като Набор от естествени числа. Това означава, че има биекция между A и набора от естествени числа. ") Може да се прочете и в Wikipedia.

Аналог на дискретните характеристики са непрекъснатите характеристики. Те се определят от факта, че могат да приемат безкраен брой форми. На практика това се изразява с факта, че теоретично винаги могат да се вмъкнат допълнителни нови стойности между две близко разположени стойности на непрекъсната характеристика, ако основната характеристика може да бъде измерена само с достатъчна точност. Пример за това е спецификацията на нивото на водата в cm. Между двете части от информация 10,5 см и 10,6 см можете да поставите произволен брой допълнителни части от информацията: 10,51 см, 10,511 см, 10,512 см и др. По принцип всичко, което може да бъде измерено физически (с нарастваща точност).

Типична грешка при разграничаване между непрекъснати и дискретни характеристики, която все още трябва да се спомене в този момент, се крие в предположението, че наличието на десетични знаци автоматично означава, че присъства непрекъсната характеристика. Например скалата на Рихтер, която се използва за измерване на силата на земетресенията („Земетресение с магнитуд 4,4 по скалата на Рихтер се разтърси днес ...“), въпреки десетичните си знаци, има само много ограничен брой възможни стойности и следователно е дискретна обмисли.

Квазинепрекъснати функции

И накрая, ще бъде разгледан специален случай с квазинепрекъснатите функции. Това са характеристики, които в основата си са дискретни (т.е. те имат ограничен или преброим безкраен брой проявления), но които имат толкова много възможни прояви, че в практическа употреба те се третират като непрекъснати характеристики (и по този начин „почти стабилни“) стават - оттук и изразът „квазинепрекъснато”). Типичен пример за това е информацията за цените (например в евро и центове): Разбира се, информацията за цената може да приеме само ограничен брой форми - но толкова много (1,00 EUR; 1,01 EUR; 1,02 EUR. ...), че може Струва си да се преструвате, че има безкраен брой характеристики - и да третирате действително дискретната променлива като непрекъсната променлива.

Упражнение: нива на скалата и типове променливи

Какво ниво на мащаба (вижте предишната публикация в блога) има следните характеристики - и те са непрекъснати или дискретни?

- дълбочината на водата на плувен басейн
- Телефонни номера на клиенти за доставка
- Аромати на сладолед
- Училищни оценки по скала от 1 до 6
- Разстояние между две сгради в cm
- Цена на нова кола в евро и цента
- Цвят на косата на клиентите във фризьорския салон
- Температура на тлеещ труп
- Оценка на продукта по скала от 1 до 5
- Проучете оценки по скала от 1,0 до 5,0

Моля, кликнете тук, за да видите решенията.

Представеното тук съдържание и задачи са част от лекцията „Основи на статистиката“ в хоноруваната бакалавърска степен по бизнес администрация в Университета за приложни науки в Харц. Пълен преглед на цялото съдържание на тази лекция в Science Tower можете да намерите тук: Основи на статистиката.