Начало - Специализация на Яндекс „Машинно обучение и анализ на данни“


За кого е това
специализация
За
възпитаници
и ученици

За
професионален
анализатори

За
директори
фирми
Характеристика:
специализации


Напълно на руски

Разширено обучение на базата на MIPT
Дистанционно


Дипломна работа,
практичен
Назначаване на работа
до топ компании

Преподаватели

Константин Воронцов

Вадим Стрижов

Евгений Рябенко

Евгений Соколов

Виктор Кантор

Емели Драл
Програма изучаване на

Дипломна работа
"Математика и Python за анализ на данни"
Библиотека на Python и линейна алгебра.
Оптимизация и разширяване на матрицата.
Анализът на данните и машинното обучение се основава на резултатите от математическия анализ, линейната алгебра и теорията на вероятностите. Без фундаментални познания по тези науки е невъзможно да се разберат методите за анализ на данните.
Първият курс ще формира тази основа. Ще разкрием значението на математическите понятия и обекти без сложни формули и доказателства.
„Учене от етикетирани данни“
Машинно обучение и линейни модели.
Линейни модели и оценка на качеството.
Решителни дървета и моделни композиции.
Невронни мрежи и преглед на методите.
Етикетираното обучение или контролирано обучение е способността да се предскаже стойност за всеки обект с краен брой примери. Например нивото на задръствания на участък от пътя, възрастта на потребителя според действията му в интернет, цената на употребяван автомобил В този курс ще научите как да формулирате и решавате такива проблеми.
„Намиране на структура в данните“
Намаляване на размерите и декомпозиции на матрицата.
Визуализация на данни и търсене на аномалии.
От курса ще научите за алгоритмите за групиране на данни, които могат да се използват за търсене на групи от подобни клиенти на мобилен оператор. Ще научите как да изграждате разширения на матрици и да решавате проблем за тематично моделиране, да намалявате размера на данните, да търсите аномалии и да визуализирате многоизмерни данни.
„Извличане на изводи от данни“
Основи на статистиката и тестване на хипотези.
AB тестове: основи на планирането, проектиране и интерпретация на резултатите.
Познаването на методите за анализ на данни влияе ли върху заплатите? Работи ли системата за оценка на кредитоспособността на клиентите на банката? Наистина ли новият банер е по-добър от стария? За да отговорите на тези въпроси, трябва да съберете данни. 99% от данните съдържат „шум“, така че заключенията въз основа на тях не са верни, а само вероятни. В този курс ще научите как да правите правилни заключения, да оценявате параметри, да тествате хипотези и да установявате причинно-следствени връзки.
"Приложни проблеми на анализа на данни"
Препоръки и класиране.
В този курс ще анализираме приложни проблеми от различни области на анализ на данни: анализ на текст и извличане на информация, съвместно филтриране и препоръчителни системи, бизнес разузнаване, прогнозиране на времеви редове.