Глава 3: ОСНОВНИ ЦЕННОСТИ
Има три основни ценности:

- Режимът
- медианата
- средното
След като се научим как да ги изчисляваме, ще проучим техните свойства и след това ще видим как сравнението на трите централни стойности дава възможност да се отчете формата на разпределение и кои са централните стойности, които имат най-много интересни имоти.
3.1 ИЗЧИСЛЕНИЕ НА ЦЕНТРАЛНИ СТОЙНОСТИ
3.2 ОСНОВНИ ЦЕННОСТИ И ФОРМИ НА РАЗПРЕДЕЛЕНИЯ
3.3 ШЕСТТА СВОЙСТВА НА YULE
| Общо меню | Предишна глава | Следваща глава |
3.1 Изчисляването на централните стойности
Може да се изчисли само за количествени характеристики. Стойностите, класифицирани във възходящ ред, медианата е стойността на знака, която го разделя на два набора с еднакви размери: 50% от стойностите са по-големи от него и 50% са по-малки от него.
Изчисляване на медианата от елементарната таблица
Подреждаме масива и търсим елемента, който разделя разпределението на две равни части, тоест този, който има ранг (n + 1)/2. Ако разпределението има нечетен брой елементи, ние намираме една стойност, която е медианата, ако разпределението има четен брой елементи, ще намерим две стойности, които определят среден интервал: тогава вземаме за медиана центъра на този медианен интервал.Пример: В компанията Zykosar (вж. Таблица 1 от предишната глава) каква е средната заплата ?
Отговор: знаейки, че има 20 служители, рангът на медианата е равен на (20 + 1)/2 или 10.5. Следователно средната заплата е средната заплата на лицата, които заемат 10-то място и 11-то място в разпределението, т.е. (2700 + 2900)/2. Средната заплата в компанията Zykosar е 2800 CR $.
Медианата е стойността, най-близка до всички останали и тя е тази, която минимизира разстоянията в абсолютна стойност:
| НЕS½ Xi - A ½ е минимум, ако и само ако A е медианата на символа Xi = 1 |
Пример за приложение: местоположение на бензиностанция за обслужване на 6 бензиностанции, разположени на км 0, 50, 100, 200, 300, 400, 700. Оптималното местоположение е в средната точка на 6 стойности. Да речем на км 200 (минимално разстояние до 6 бензиностанции). Таблицата по-долу дава възможност да се провери дали нито централната точка (max-min)/2, нито средната точка предлагат по-добро местоположение.
| Станции разположен на км n ° | Разстояние до средната точка (200) | Разстояние до средната точка (250) | Разстояние до централната точка (350) |
| 0 | 200 | 250 | 350 |
| 50 | 150 | 200 | 300 |
| 100 | 100 | 150 | 250 |
| 200 | 0 | 50 | 150 |
| 300 | 100 | 50 | 50 |
| 400 | 200 | 150 | 50 |
| 700 | 500 | 450 | 350 |
| Обща сума | 1250 | 1300 | 1400 |
По принцип може да се изчисли само за непрекъснати количествени характеристики. На практика се изчислява и за дискретни количествени характеристики, което води до очарователния резултат, че можем да имаме 2,2 деца на жена (какво да правим с 0,2?).
Изчисляване на средната стойност от елементарен масив
Средната стойност е сумата от стойностите, разделена на броя на елементите:| НЕ С = S Xi/Ni = 1 |
Тази формула всъщност съответства на частен случай на средно претеглена стойност, когато даваме еднакво тегло на всеки от индивидите.
Отговор: общата работна заплата е 200 000 CR $, а броят на служителите е 20, получаваме средна заплата от 10 000 CR $. Тази средна заплата очевидно отразява само много несъвършено заплатата, получавана от повечето служители. Ако директорът бъде отстранен, заплатата на останалите 19 служители ще бъде средно само (100 000/19) = 5263 CR $. Ако премахнем и двамата заместник-директори, заплатата на останалите 17 служители тогава ще бъде средно само 2 941 CR $. .
Следователно можем да видим, че в този пример средната стойност е много лошо обобщение на разпределението поради наличието на изключителни стойности (директор) и силна асиметрия на хистограмата (концентрация на заплатите в ниските стойности и дисперсия във високи стойности).