Онлайн калкулатор Експоненциално изглаждане

Теория на експоненциално изглаждане

Тъкмо се канех да напиша друга статия за техническите показатели и да поговоря за това експоненциална пълзяща средна (експоненциална пълзяща средна, EMA), обаче се оказа, че докато изучавах теорията на този показател, попаднах на доста интересни неща, които все още се отнасят повече до статистиката, отколкото до фондовия пазар или форекс.

Тъй като статистическите данни вече са засегнати на този сайт, реших да напиша отделна статия по тази тема, а именно статия за метода експоненциално изглаждане (експоненциално изглаждане) в анализа редове динамика (времеви редове)

Темата за поредиците от динамика вече е засегната в статията Сезонни колебания. Сезонни индекси. Методът с постоянна средна стойност, и там беше казано, по-специално, че изчисляването на средните индекси на сезонност на методите с постоянна средна стойност може да се използва за времеви редове, когато няма тенденции нагоре/надолу или те са незначителни. С други думи, наблюдаваната стойност се колебае около някаква постоянна стойност.

Какво означава? Това означава, че средната стойност е постоянна, постоянна е и следователно не може да улови тенденцията.
Нека илюстрираме това с графика

Постоянна средна стойност - графика

Редица говорители

Редица говорители

Импортиране на данни Грешка при импортиране

Най-общо казано, всички методи за усредняване са насочени към елиминиране на „шума“ от случайно разпръскване на данни, което прави възможно по-ясното идентифициране на тенденция или сезонни или циклични промени, т.е. вътрешната структура на данните, която изглежда случайна, и използвайте това, за да изградите модел с последващ анализ и прогнозиране на бъдещи стойности - но, както виждаме, простият метод на осредняване не работи при наличието на ясно изразена тенденция и нищо не може да се предскаже с негова помощ.

Трябва да можете да получите не една, постоянна, средна, но отново серия от средни стойности, които биха се опитали да отразят тенденцията в данните. Е, най-популярният (и най-простият) метод за получаване на такива серии е методът на експоненциално изглаждане.

С думи може да се опише както следва - При прогнозирането по-новите наблюдаеми стойности имат по-голяма тежест от по-старите стойности. В този случай на по-старите стойности се присвояват експоненциално намаляващи тегла.

Сега описваме това определение чрез формулите.
Традиционно ще обозначаваме наблюдаваната стойност като, а изгладената средна като .
Тогава,
неопределено

където взема стойност от диапазона [0; 1)

Откъде идва експонентата - нека отворим предишните средни стойности

По този начин тежестите отпред са безкрайно намаляваща геометрична прогресия с коефициент
И колкото по-нататък S, толкова по-малко първоначалните стойности му влияят.

Да предположим, че нека да видим как неговият принос се променя за различни S.

Промяна в стойностното тегло с експоненциално изглаждане

За S2 се приема такъв, какъвто е, но в S3 с алфа коефициент 0,5 приносът на y1 ще бъде само 250, в S4 - 125 и т.н.

В този случай изборът на коефициента е от голямо значение. Ако се заиграете с параметъра "a" в калкулатора (вижте по-горе), става ясно, че колкото по-висока е стойността му, толкова по-бързо отчитането всъщност престава да влияе на изгладената средна стойност и обратно - колкото по-ниско, толкова по-дълго е влиянието му трае.

Съответно, при малки, методът за получаване на S2 оказва голямо влияние върху резултата. Възлагането е само един метод. Като алтернатива първоначалната стойност може да бъде обикновена средна стойност за първите няколко y стойности, например.

Но как избирате? Кой показател е най-подходящ за моделиране на дадена серия от динамика? Няма математически формули за точно изчисление. Този индикатор най-често се избира от метода за подбор или от метода на пробите и грешките. Видях името "научен метод на мушкане" няколко пъти:)

Методът се състои в приемане на няколко стойности и след това избор на една от най-добрите сред тях. Какъв е критерият „най-добър“ в нашия случай?

Този критерий е да се сведе до минимум средната стойност на грешките на квадрат. Грешка е отклонение на действителната стойност от прогнозата. За всяка стойност на S на квадрат се премахва влиянието на знака и след това се изчислява средната стойност на всички стойности. Индикаторът, за който средната стойност е минимална и е най-добрият от няколко.

Сега няколко думи за прогнозирането.

Следващата стойност на поредицата се прогнозира директно от формулата

Ако трябва да получите прогноза за по-голям брой проби, се използва техника, наречена bootstrapping (дори не знам кой адекватен руски термин е подходящ тук). Последната известна стойност "y" се приема като константа и се използва в рекурсивната формула

Сега ще приложим знанията, получени при изчисляването на изгладената средна стойност за графиката, дадена в началото на статията. За да бъде по-интересно, изчисляваме изгладената средна стойност за три стойности наведнъж и в същото време изчисляваме грешката на средно-квадратния квадрат.

Графиката показва следващата предсказана стойност за справка, т.е. изгладените средни стойности се удължават с едно броене над действителните данни.