Перейти к содержимому

Дата сайнс где учиться

  • автор:

Что выбрать, чтобы стать дата-сайентистом: самообразование, онлайн-курсы или вуз?

Что выбрать, чтобы стать дата-сайентистом: самообразование, онлайн-курсы или вуз?

Чтобы стать дата-сайентистом, можно засесть за книги, поступить в вуз или пройти хорошие курсы. Рассказываем про преимущества и недостатки всех способов и советуем, с чего начать.

Освойте профессию «Data Scientist»

Что такое Data Science?

Data Science — это наука о данных. Ее методы позволяют обрабатывать большие объемы информации. Дата-сайентист строит разные модели, и по их результатам находит неочевидные закономерности и делает прогнозы. Дата-сайентисты нужны там, где можно извлечь пользу из больших объемов информации: в крупном бизнесе, стартапах, научных организациях. Методы Data Science широко применяются в розничной торговле, банковской сфере, медицине, метеорологии и химии.

Профессия / 24 месяца
Data Scientist
Решайте амбициозные задачи с помощью нейросетей
5 491 ₽/мес 9 983 ₽/мес

Group 1321314349 (2)

Дата-сайентисту важно хорошо знать математику: линейную алгебру, теорию вероятности, статистику, матанализ. Чтобы применять математические модели на практике, нужно знать Python, SQL, уметь работать с библиотеками и фреймворками для машинного обучения. Для более сложных задач понадобится язык С или C++.

Читайте также Кто такой Data Scientist и чем он занимается

Изучать самостоятельно

  • денежных вложений почти не требуется (разве что придется купить несколько учебников);
  • можно выбирать время, продолжительность занятий и темп обучения.

Минусы:

  • нехватка знакомств в профессиональной сфере (можно восполнить с помощью онлайн-чатов для начинающих, например этого);
  • нет возможности оценить актуальность знаний;
  • отсутствие наставника;
  • высокий риск все бросить, только начав.

Шаг 1. Мониторим рынок

В первую очередь стоит узнать, какие скилы хочет видеть у сотрудника ваш идеальный работодатель. База — это теория вероятности, высшая математика и статистика.

Далее — навыки, связанные непосредственно с профессией. Чаще всего это основы программирования на Python и работа с библиотеками Pandas и NumPy. А еще — выгрузка баз с помощью SQL, работа c файлами, HTML-страницами и API.

Будущие дата-сайентисты должны понимать, как применять для решения бизнес-задач машинное обучение и что оно из себя представляет (Machine Learning — это методы разработки алгоритмов, которые помогают решать задачи на основе поиска закономерностей в различных данных).

Науки о данных

Group 1321314349 (2)

Шаг 2. Получаем базовые знания

Конечно, полному гуманитарию на первых порах будет сложно разобраться с большими данными. Рекомендуем начать с прокачки теоретической базы.

Самые крутые теоретические книги:

  1. «(Не)совершенная случайность», Леонард Млодинов. Увлекательная книга о теории вероятности, роли случая и закономерности в нашей жизни.
  2. «Голая статистика», Уилан Чарльз. Автор доказывает, что статистика — совсем не скучная, и на живых примерах конкретных компаний объясняет, как работают большие данные.
  3. YouTube-канал с анимированными роликами, объясняющими основные законы математики.
  4. «О чем говорят цифры», Том Дэвенпорт и Ким Джин Хо. Книга о том, как сбор данных пригождается в реальной жизни и бизнесе.

Основы Python:

  1. «Изучаем Python», Марк Лутц. Самая подробная книга об основах этого языка программирования.
  2. Python Tricks, Дэн Бейдер. Автор пишет о хитрых трюках, которые стоит изучить, если вы хотите программировать быстрее.
  3. Real Python Tutorials. Сайт для изучения Python с нуля: классные мультики и постепенное погружение.
  4. Портал, где можно найти информацию по всем основным вопросам, которые возникают в начале пути.
  5. «Python. К вершинам мастерства», Лучано Рамальо. Отлично подходит для аналитиков — как начинающих, так и продвинутых.
  6. «Искусственный интеллект с примерами на Python», Пратик Джоши. Подойдет для начинающих погружение в Machine Learning.

Введение в Data Science:

  1. Numsense! Data Science for the Layman, Су Кеннет, Анналин Ын. Авторы описывают основные принципы работы с большими данными.
  2. Data Science from Scratch, Грас Джоэл. В этом пособии описаны программные библиотеки, модули, пакеты инструментов и основные платформы. Подходит для начинающих.
  3. Библиотека материалов по Pandas от канала DataLytics, Алексей Макаров.
  4. Статья, в которой рассматриваются плюсы и минусы популярных сервисов бизнес-аналитики: Power BI, Qlik Sense, Tableau.
  5. «SQL для простых смертных», Мартин Грабер. Это пособие для тех, кто никогда не работал с базами данных. Все объясняется пошагово и доступно.

Шаг 3. Выполняем пробные кейсы

Существуют специальные сайты, где проводятся соревнования по анализу больших данных. Самый крупный зарубежный — Kaggle, в русскоязычном сегменте — Boosters.Pro. Здесь крупные компании предлагают решить реальные рабочие задачи, которые можно потом добавить в свое резюме.

Читайте также Что такое Kaggle и зачем он дата-сайентисту?

Шаг 4. Вливаемся в комьюнити и пишем резюме

На этом этапе уже можно искать профессиональные чатики и просить коллег делиться своим опытом. Не бойтесь задавать вопросы, чтобы в итоге составить для работодателя идеальное резюме. В сфере Data Science спрос на специалистов все еще больше, чем предложение.

Поступить в вуз

Плюсы:

  • в университете можно попробовать поступить на бюджет или получить серьезную скидку на обучение (например, такая возможность есть в ВШЭ);
  • есть большое поле для нетворкинга;
  • возможность изучать дополнительные предметы другого профиля;
  • низкая вероятность все бросить из-за поддержки коллектива.

Минусы:

  • высокая стоимость платного обучения, полный курс занимает много времени (2 или 4 года в зависимости от уровня);
  • необходимо посещать очные занятия;
  • многие знания могут быть устаревшими;
  • часто много теории и мало практики.

Станьте дата-сайентистом и решайте амбициозные задачи с помощью нейросетей

Куда пойти учиться?

Оксана Дереза была филологом, но решила переквалифицироваться — и пошла на «технарскую» магистратуру ВШЭ. В то время, когда Оксана училась в университете, специальных курсов не существовало. Сейчас она — ментор SkillFactory.

Вот несколько вариантов прохождения обучения в области Data Science в России.

Бакалавриат
  • Программы МФТИ и Skillfactory — для тех, кто всегда мечтал о физтехе. От 160 000 рублей за семестр.

Программы высшего образования Skillfactory подойдут как для выпускников технических вузов, так и для тех, у кого нет математической подготовки. Поступившие получат все лучшее от академического мира и онлайн-образования: фундаментальную подготовку, практику и стажировки на реальных задачах от компаний-партнеров.

  • Бауманка и Mail.Ru — больше возможностей для трудоустройства.От 270 тысяч рублей в год.

Как и в Физтехе, в Бауманке Data Science доступны не всем: сначала нужно изучить основы. На университетскую программу «Технопарк» совместно с российским IT-гигантом могут поступить студенты Бауманки со второго курса и выше — по конкурсу.

Магистратура
  • Совместная онлайн-программа НИТУ МИСиС и SkillFactory — для тех, кто хочет учиться из любой точки мира.От 265 тысяч рублей в год (можно взять образовательный кредит).

Абитуриенты должны владеть азами математики и информатики. Но МИСиС ждет на «Науках о данных» не только технарей — для желающих есть подготовительные курсы и консультации.

Диплом онлайн-магистратуры ничем не отличается от «физической» (даже дает отсрочку от армии). Среди преподавателей — университетские профессора и специалисты из Microsoft или BIOCAD. Студенты будут готовить реальные проекты, например для Ростелекома и Nvidia. Партнеры курса обещают помощь с трудоустройством.

  • СПбГУ — для любителей Петербурга. От 265 500 рублей в год.

Программа «Исследование операций и системный анализ» предполагает, что абитуриенту уже знакомы прикладная математика и информатика. По крайней мере, конкурс портфолио проводится среди бакалавров и специалистов в этой области.

Университет обещает, что после выпуска магистр сможет работать с большими данными и анализом систем массового обслуживания. Выпускники работают в Сбербанке, Газпроме и Mail.ru.

  • МГУ — для поклонников классического образования. От 241 250 рублей в год (вечерняя форма обучения).

Есть целых два направления на выбор: «Интеллектуальный анализ больших данных» и «Большие данные: инфраструктуры и методы решения задач». Поступить без специальной подготовки также будет сложно — абитуриентов ждут вступительные по математике и информатике. Зато после выпуска счастливчиков ждут «Лукойл», «Транснефть» и другие топовые компании.

  • НИУ ВШЭ — для тех, у кого международные амбиции. От 675 тысяч рублей в год (но можно получить скидку до 40% при хороших результатах экзаменов).

Вышка предлагает изучать «Науку о данных». Порог вхождения на программу ниже, чем в классические вузы, — сдавать придется только математику (но на английском). Обучение проходит на двух языках.

Студентов ждет двойной диплом с французским университетом Блеза Паскаля — и, как следствие, больше возможностей для трудоустройства за границей. Среди «звезд» факультета — сотрудники Google и Яндекса.

Начните карьеру в Data Science.
Онлайн-магистратура МФТИ с практикой на реальных проектах

Обучаться онлайн

Плюсы:

  • стоимость точно ниже, чем в любом вузе;
  • времени на прохождение курса нужно меньше;
  • более гибкая система — с онлайн-занятиями и возможностью подстроиться под ученика;
  • самые актуальные знания.

Минусы:

  • курсы сложно совмещать с интенсивной работой (нужно время на домашние задания).

Я думаю, что здесь можно говорить не столько про минусы, сколько про сложности. У студента должен быть высокий уровень самоорганизации. Нужно быть готовым к тому, что, приняв решение об обучении, придется жить в условиях постоянных дедлайнов. Data Science — сложная сфера. Нужно настроиться на интенсивную работу

Юлия Пушкина, руководитель карьерного центра SkillFactory

Как понять, что курс вам подходит?

Оценить успехи выпускников

Обычно онлайн-курсы гордятся своими выпускниками и даже берут у них интервью. Изучите опыт коллег и переложите его на свою образовательную траекторию: так будет проще выбрать ту программу, которая подойдет именно вам.

Читайте: Все истории наших выпускников
Посмотреть, как компания, продающая курсы, помогает в трудоустройстве

В некоторых онлайн-школах есть карьерные центры. Другие дают доступ к эксклюзивным HR-чатам или стажировкам. Изучите, с какими образовательными программами сотрудничает ваша компания мечты. Возможно, это самый короткий путь на лучшее место работы?

Цель карьерного центра SkillFactory — трудоустроить вас после окончания курсов. Эксперты разбирают в закрытых группах резюме и показывают, как строить карьеру на реальных кейсах. Карьерный центр сопровождает учащихся во время и после обучения, организует встречи с рекрутерами, рассылает резюме партнерской сети компаний и готовит к собеседованиям.

Найти то, что вас мотивирует

Мотивация — это то, что поможет пройти курс до конца. Вот три истории выпускников SkillFactory:

Виктор Андрийчук в 38 лет понял, что не преуспел в своей профессии, вдохновился рассказом об искусственном интеллекте и сначала сам изучал Data Science и программирование, а потом поступил на курс в SkillFactory. Теперь он разрабатывает сервис, который будет автоматически с помощью машинного обучения определять, является ли сообщение от клиента спамом

Евгений Денисенко танцевал в ансамбле и работал строителем. Он пробовал себя в разных сферах и в какой-то момент понял, что не хочет быть «специалистом по всему». Евгений решил стать дата-сайентистом с нуля: прошел курс SkillFactory по Data Science и считает это решение одним из лучших в жизни. Сейчас у него есть возможность совмещать математику, программирование и творчество.

Наталья Вольдман посвятила 10 лет центру повышения квалификации, но работа перестала её радовать. Она пробовала работать интернет-маркетологом и изучать программирование, но по совету знакомого стала изучать Data Science и поняла, что это именно то, что ей интересно. Теперь она — старший скоринг-аналитик: разрабатывает и валидирует скоринговые модели по оценке возврата или невозврата займов.

Узнать, останутся ли материалы у вас после прохождения курса

Бывает, что в самом начале рабочего процесса вам нужно уточнить что-то или вернуться к аспекту, который вы не успели достаточно изучить. Материалы пройденного курса могут стать большой поддержкой в таком случае. Узнайте, останутся ли они с вами после завершения учебы.

Data Scientist

Дата-сайентисты решают поистине амбициозные задачи. Научитесь создавать искусственный интеллект, обучать нейронные сети, менять мир и при этом хорошо зарабатывать. Программа рассчитана на новичков и плавно введет вас в Data Science.

Data Scientist (Специалист по обработке, анализу и хранению больших массивов данных)

Data Scientist (Специалист по обработке, анализу и хранению больших массивов данных)

Data Scientist (дата-сайентист или датасаентист) обрабатывает и анализирует массивы больших данных (Big Data), чтобы с использованием алгоритмов машинного обучения найти в них новые связи и закономерности и построить прогнозную алгоритмическую модель, которую можно использовать для решения задач бизнеса, науки, повседневной жизни. Профессия подходит людям с аналитическим складом ума и способностями к математике. Кстати, недавно центр профориентации ПрофГид разработал точный тест на профориентацию, который сам расскажет, какие профессии вам подходят, даст заключение о вашем типе личности и интеллекте.

Data Science – наука о данных на стыке разных дисциплин: математика и статистика; информатика и компьютерные науки; бизнес и экономика.

С. Мальцева, В. Корнилов. НИУ ВШЭ

Профессия новая, актуальная и чрезвычайно перспективная. Термин Big Data появился в 2008 году. А профессия Data Scientist – «учёный по данным» официально зарегистрирована как академическая и межотраслевая в начале 2010 г. Хотя первое упоминание термина data science было отмечено в книге Петера Наура 1974 г., но в ином контексте.

Как узнать, подходит ли вам профессия «Data Scientist»?

Тест на профориентацию

Читайте также

Профессия «Data Mining Specialist»

Краткое описание

Data Scientist работает с Big Data (большими данными) – огромными массивами неструктурированной информации.

  • Мечтаешь создать свою игру?

Мечтаешь создать свою игру?
Воплоти мечту в реальность вместе с XYZ School!

Черная пятница в Skillbox: месяц инвестиций в себя!

Черная пятница в Skillbox: месяц инвестиций в себя!
Получи скидку, курс в подарок и гарантию трудоустройства, чтобы стать востребованным специалистом.

Массивы больших данных подразделяют на 3 вида:

  • структурированные (например, данные кассовых аппаратов в торговле);
  • полуструктурированные, или слабоструктурированные (сообщения email, статистика из трекеров событий: Yandex.Metrika, GAnalytics и т. д.);
  • неструктурированные (видеофайлы, изображения, текстовые посты в соцсетях, метеорологические сводки, аудиозаписи, результаты спортивных матчей, базы геномов и многое другое).

Большая часть информации в Big Data – это неструктурированные или слабоструктурированные данные, что значительно усложняет их анализ. В работе с такими данными дата-сайентист пользуются методами математической статистики и машинного обучения (machine learning, ML).

  • НОВОГОДНЯЯ РАСПРОДАЖА SKILLBOX

НОВОГОДНЯЯ РАСПРОДАЖА SKILLBOX
При покупке курса со скидкой до 60% выберите второй курс в подарок.

Новогодняя акция! Скидки до 60% и «Тайный Санта»

Новогодняя акция! Скидки до 60% и «Тайный Санта»

Всеми любимый «Тайный Санта» здесь: те, кто приобрел у нас курс, получат курс в подарок и смогут подарить мини-курс своему другу.

Скидки 70% и подарки на сумму до 260 000 ₽

Скидки 70% и подарки на сумму до 260 000 ₽
Покупаете один курс — получаете два. Год английского от Skyeng +1 профессия в подарок.

Задача дата-сайентиста – проанализировать большие данные, чтобы на их основании сделать прогнозы. Какие именно – зависит от решаемой задачи. Результат работы Data Scientist′а – прогнозная модель, упрощённо, это программный алгоритм, который находит оптимальное решение поставленной задачи.

Благодаря работе дата-сайентистов бизнес может принимать взвешенные решения, основанные на разного рода данных, и опережать своих конкурентов, а продукты становятся более удобными и полезными для людей.

Особенности профессии

Обычные специалисты по статистике, системный аналитик или бизнес-аналитик по отдельности не могут обрабатывать массивы информации, которые относятся к категории Big Data. Для этого нужен профи с междисциплинарным образованием, компетентный в математике и статистике, экономике и бизнесе, информатике и компьютерных технологиях, – специалист по работе с данными, то есть Data Scientist.

Главные задачи Data Scientist´а:

  • извлекать необходимую информацию из самых разнообразных источников, используя информационные потоки в режиме реального времени;
  • устанавливать скрытые закономерности в массивах данных и статистически анализировать их для принятия грамотных бизнес-решений.

Рабочиее место датасайентиста – не 1 компьютер и даже не 1 сервер, а кластер серверов.

Data Scientist, как настоящий учёный, занимается не только сбором и анализом данных, но и изучает их в разных контекстах и под разными углами, подвергая сомнению любые предположения. Важнейшее качество дата-сайентиста – это умение видеть логические связи в системе собранной информации и на основе количественного анализа разрабатывать эффективные бизнес-решения. В современном конкурентном и быстро меняющемся мире, в постоянно растущем потоке информации Data Scientist незаменим для принятия правильных бизнес-решений.

Что делает Data Scientist

В разных компаниях задачи дата-сайентиста будут отличаться, но основные этапы работы похожи:

  1. Выяснить, что нужно заказчику.
  2. Оценить, возможно ли решить поставленную задачу методами машинного обучения (ML).
  3. Собрать данные для анализа, преобразовать их в формат, более удобный для работы по методике ML. (Если возможность применить ML есть, а если целесообразнее использовать методы математической статистики, визуализации, то задачу решает бизнес-аналитик.)
  4. Найти критерии оценки, чтобы выяснить, насколько эффективной будет модель, которую предстоит создать.
  5. Запрограммировать и «натренировать» модель ML.
  6. Оценить экономическую целесообразность применения этой модели (на этом этапе возможна помощь других специалистов – бизнес-аналитика, главного экономиста предприятия и др.).
  7. Внедрить модель в производство/продукт.
  8. Сопровождать внедренную модель – дорабатывать, если нужно, или адаптировать под текущие запросы заказчика.

Что можно сделать по такому шаблону? Очень много. Дата-сайентисты создали сотни сервисов, к которым мы давно привыкли и пользуемся каждый день. Алгоритмы поисковых систем, прогнозы погоды в смартфонах, голосовые помощники, программы распознавания лиц или изображений, рекомендательные алгоритмы, подбирающие видео и музыку или потенциальных друзей в соцсетях, чат-боты – всё это плоды трудов Data Scientist′ов.

В работе с данными Data Scientist использует:

  • статистические методы;
  • моделирование баз данных;
  • методы интеллектуального анализа;
  • искусственный интеллект для работы с данными;
  • методы проектирования и разработки баз данных.

Разница между Data Scientist и другими Data-специалистами

С Big Data работают многие специалисты, но у каждого из них свои инструменты и цели.

Отличие Data Scientist от Business Analyst

Дата-сайентист и бизнес-аналитик (Business Analyst) делают выводы, опираясь на данные, но разница состоит в результате их работы. Data Scientist находит в данных связи и закономерности, чтобы создать прогнозную модель и предсказать результат. Фактически дата-сайентист смотрит в будущее. При этом он решает поставленную задачу технически, пользуясь алгоритмами и математической статистикой.

Бизнес-аналитика интересуют коммерческие метрики компании. Опираясь на статистику, он может оценить, к примеру, эффективность рекламы, динамику продаж за определенный период. Эту информацию из прошлого бизнес-аналитик может использовать для предложений, как улучшить показатели компании. Когда данных много и нужен основанный на них прогноз, то техническую сторону задачи помогает решить Data Scientist.

Итак, результат работы дата-сайентиста – алгоритмическая модель, код, написанный на основе анализа данных. Data Scientist – это технический специалист. Результат работы бизнес-аналитика – визуализированные рекомендации, как улучшить коммерческие показатели компании. Эти советы тоже делаются на основе анализа данных, но бизнес-аналитик погружается в бизнесовую составляющую задачи.

Отличие Data Scientist от Data Engineer

Оба специалиста – технические. Они делают данные качественными и доступными, часто работают в связке, поэтому их обязанности и зону ответственности нередко путают.

Data Scientist на основе потребностей бизнеса формулирует задачи анализа данных. Он знает, какие именно данные нужны, умеет находить в них закономерности (иногда не замеченные другими) и создает прогнозные модели, в случаях, когда можно и нужно применить методы ML. Дата-сайентист контролирует качество разработанной модели и оценивает эффект ее применения.

Data Engineer собирает данные, обеспечивает их качественную структуру, чтобы Data Scientist мог тренировать и внедрять алгоритмы и модели ML. Data Engineer может обработать гигантские объемы информации и добыть из них самое важное, он знает, как наладить регулярную выгрузку и интеграцию противоречивых или неполных данных из разных источников.

Итак, задачи Data-инженера и дата-сайентиста разные:

  • Data Engineer предоставляет очищенные и структурированные данные дата-сайентисту, разрабатывает пайплайн поддержки алгоритма ML;
  • Data Scientist тестирует гипотезы в системе данных, разрабатывает алгоритмы.

Data Scientist находит в данных коммерчески важную информацию для построения стратегии компании и изучает возможность использования ML. Data Engineer – командный работник, его задача – обеспечить высокую продуктивность бизнес-аналитиков, связывать членов команды разработки ПО.

Плюсы и минусы профессии

Плюсы:

  • Профессия Data Scientist чрезвычайно востребованная в России и за рубежом, на рынке острый дефицит специалистов по данным такого уровня.
  • Высокооплачиваемая профессия.
  • Интересная работа для тех, кто увлечен IT-технологиями и математикой. Каждый проект по-своему уникален, поэтому работу не назовешь рутинной.
  • Профессия Data Scientist´а обязывает быть всесторонне развитой, интеллектуальной личностью: надо быть в курсе трендов в экономике, торговле, культуре, образовании, социологии и многих других сферах жизни и главное – уметь анализировать их и делать выводы.

Минусы:

  • Не каждый человек сможет освоить профессию Data Scientist´а, нужен особый склад ума.
  • При построении моделей могут не сработать известные методы и более 60% идей. Множество решений окажется несостоятельным, и нужно иметь большое терпение, чтобы получить удовлетворительные результаты. Data Scientist не имеет права сказать «нет» проблеме. Он должен найти способ, который поможет решить поставленную задачу.
  • Большая ответственность: ошибки дата-сайентиста дорого стоят компаниям. Например, из-за просчётов в построении скоринговой модели (оценивает кредитоспособность) банк массово выдаст займы ненадёжным клиентам, которые не вернут деньги.

Место работы

Data Scientist – незаменимый сотрудник везде, где надо делать прогнозы, совершать сделки, оценивать риски. Основные сферы применения знаний и навыков дата-сайентистов:

  • высокотехнологические отрасли производства;
  • наука;
  • IT (оптимизация поисковой выдачи, фильтр спама, систематизация новостей, автоматические переводы текстов и многое другое);
  • медицина (автоматическая диагностика болезней);
  • финансовые структуры (принятие решений о выдаче кредитов) и т. д.;
  • телекоммуникации;
  • транспорт;
  • крупные торговые сети;
  • сельское хозяйство;
  • страхование;
  • социология.

По сведениям Академии больших данных MADE Mail.ru Group и hh.ru, три основные сферы занятости Data Scientist′ов: ИТ (38 % вакансий), финансы (29 %), B2B (9 %).

Data Scientist может работать и со стартапами, и с транснациональными корпорациями. В небольших, начинающих бизнесах дата-сайентист обычно один и решает отдельные задачи. В крупных компаниях в сотрудничестве с аналитиками данных и бизнес-аналитиками, сисадминами, программистами, Data-инженерами, дизайнерами, менеджерами проектов Data Scientist занимается долгосрочными проектами.

Важные качества

  • Аналитический склад ума.
  • Трудолюбие.
  • Настойчивость.
  • Скрупулёзность, точность, внимательность.
  • Способность доводить исследования до конца, несмотря на неудачные промежуточные результаты.
  • Коммуникабельность.
  • Умение объяснить сложные вещи простыми словами.
  • Бизнес-интуиция.

Читайте также

Профессия «Big Data Analyst (аналитик больших данных)»

Профессиональные знания и навыки

  • Математика, матанализ, математическая статистика, теория вероятностей.
  • Подготовка данных к анализу с использованием библиотек.
  • Английский язык.
  • Языки программирования, у которых имеются компоненты для работы с большими массивами данных: SQL, Java (Hadoop), C ++ (BigARTM, Vowpel Wabbit, XGBoost), Python (Matplotlib, Numpy, Scikit, Skipy). Чаще всего дата-сайентисты пользуются SQL, Python, а для сложных вычислений – C/C++.
  • Статистические инструменты: SPSS, R, MATLAB, SAS Data Miner, Tableau и др.
  • Основательное знание отрасли, в которой работает Data Scientist (например, если это фармацевтическая отрасль, то необходимо знание основных процессов производства, компонентов лекарств).
  • Законы развития бизнеса.

Data Science – это использование научных методов в работе с большими данными для того, чтобы найти нужное решение. Data Scientist работает с данными так же, как учёный любой сферы знания. Он применяет математическую статистику, логические принципы и современные инструменты визуализации, чтобы получить результат. Он должен уметь анализировать и обобщать частные наблюдения, исключать случайности, отсеивать несущественные факты и делать верные выводы.

Коротко говоря, Data Scientist′у надо знать математику, матстатистику, один-два языка программирования, принципы машинного обучения и иметь представление о той отрасли, где всё это будет использоваться для работы с данными.

Обучение на Data Scientist´а

Data Scientist должен уметь программировать, работать со статистикой, пользоваться аналитическими методами. Всему этому учат в вузах на программах ИТ-направлений, несколько примеров:

  • «Прикладная математика и информатика» (01.03.02), профили:
    • «Прикладной анализ данных и искусственный интеллект» (НИУ ВШЭ, СПб);
    • «Анализ и принятие решений» (НИУ ВШЭ, Москва);
    • «Математические и компьютерные методы в прикладных разработках» (ВГУ, Воронеж);
    • «Прикладная математика и информатика» (такой профиль есть в более чем 80 российских вузах).
    • «Применение математических методов к решению инженерных и экономических задач» (МИЭТ, УГАТУ, ВГУ, ДГТУ, ИжГТУ им. Калашникова, ОГУ);
    • «Анализ данных» (МТУСИ, РТУ МИРЭА);
    • «Математическое моделирование» (АлтГПУ, КнАГУ и др.).
    • «Аналитика и управление данными» (РЭУ им. Плеханова).

    С бэкграундом разработчика легко за несколько месяцев перейти в дата-сайентисты. Профессионалам из других сфер будет сложнее, но зато у них есть важное конкурентное преимущество – глубокое понимание своей предметной области.

    Как и в любой профессии, для Data Scientist´а важно самообразование. Для самостоятельной прокачки знаний и скиллов будут полезны:

    • Machine Learning 101 – канал ML Youtube;
    • YouTube-курс машинного обучения от «ШАД» Яндекса.
    • курсы Udacity;
    • курсы Dataquest, на которых можно стать настоящим профи в Data Science;
    • 6-шаговые курсы Datacamp;
    • обучающие видео O’Reilly;
    • скринкасты для начинающих и продвинутых Data Origami;
    • ежеквартальная конференция специалистов Moskow Data Scients Meetup;
    • соревнования по анализу данных Kaggle.сom.

    Как обучиться Data Science и стать Дата Сайентистом с нуля

    Здравствуйте! В статье расскажем, как обучиться на Data Scientist. Разберемся, кому подойдет профессия, как освоить ее с нуля, где учиться и с чего лучше начинать карьеру в Дата Сайенс.

    Кому подходит профессия

    Обычно специалистами по Data Science становятся по следующим причинам:

    • Есть желание освоить перспективную и высокооплачиваемую профессию.
    • Имеется опыт в смежной отрасли, но хочется перейти в новое, более востребованное направление. Дата Сайентистами часто становятся программисты, маркетологи, финансисты и бизнес-аналитики.
    • В профессиональной деятельности или научных исследованиях необходимо применять инновационные технологии: большие данные, нейросети, искусственный интеллект.

    Для работы в Дата Сайенс нужны навыки программирования и знание математики за рамками школьной программы. Поэтому на старте гуманитариям будет сложнее учиться и работать, чем людям с техническим складом ума или образованием.

    Чтобы стать Data Scientist, потребуется высокая мотивация и определенные личностные качества:

    • Развитое аналитическое и критическое мышление, чтобы выявлять закономерности, а не мнимые связи.
    • Широкий кругозор и любознательность, чтобы понимать, как работают бизнес-процессы.
    • Коммуникабельность, готовность к командной работе, умение налаживать контакты как с коллегами, так и с заказчиками.
    • Усидчивость, высокая работоспособность, целеустремленность, нацеленность на результат.
    • Ответственность, внимательность к деталям.

    Как обучиться Data Science с нуля

    При желании профессию можно освоить с нуля, независимо от возраста или бэкграунда. Более того, некоторые компании готовы брать специалистов без опыта, но с профильным образованием.

    Обучаться можно в государственном учебном заведении или онлайн-школе. Среди вузов, где можно учиться на Data Scientist, стоит отметить МГУ им. Ломоносова, Высшую школу экономики и Санкт-Петербургский государственный университет. Для изучения Дата Сайенс подойдут такие факультеты, как «Прикладная математика и информатика» или «Компьютерные науки и анализ данных».

    Более быстрый и удобный способ стать специалистом по Data Science – пройти онлайн-обучение. Получить новую профессию можно дистанционно в среднем за 1-2 года.

    На нашем сайте собраны лучшие курсы по Data Science на русском языке. С помощью удобного фильтра вы можете подобрать обучающую программу по стоимости, формату занятий, продолжительности, с рассрочкой или скидкой, а также с гарантией трудоустройства.

    Почему стоит выбрать online-курс:

    • Занятия ведут опытные программисты и аналитики, которые объясняют сложный материал, например, теорию вероятности или математический анализ доступным языком с примерами.
    • Записи всех уроков хранятся в личном кабинете. У вас не будет пробелов в знаниях, потому что вебинары можно смотреть неоднократно в любое время. Видео останутся у вас навсегда.
    • После каждой темы есть практическое задание. Задачи постепенно усложняются, и к концу курса вы построите нейросеть или рекомендательную систему. То есть у вас будут готовы проекты для портфолио.
    • Если вы не можете справиться с вопросом самостоятельно, вам поможет куратор. Он укажет на ошибки и даст рекомендации.
    • Многие школы бесплатно помогают с поиском работы, а также приглашают студентов на стажировку, поэтому у вас будет возможность получить опыт в реальном проекте.

    Подборка курсов Все онлайн-курсы по Data Science в 2024 году
    Посмотреть подборку

    Что нужно, чтобы стать Data Scientist

    Расскажем подробнее, какие шаги нужно пройти, чтобы стать специалистом по Data Science:

    1. Изучить математику и линейную алгебру. Если у вас есть знания в рамках школьной программы, можно начать с книг, в которых простым языком разбирают основные понятия: производную, дифференциал, матрицу и пр.
    2. В любой аналитике используется математическая статистика и теория вероятности – это следующие большие темы, с которыми необходимо ознакомиться.
    3. Работа в Дата Сайенс невозможна без знания языков программирования. Новичку подойдет Python – он относительно простой, гибкий и многофункциональный.
    4. Следующий шаг – изучение алгоритмов машинного обучения: «с учителем», «без учителя», «с подкреплением». Вам нужно научиться собирать данные для анализа и визуализировать их.
    5. Разобравшись с теорией, переходите к практике. К примеру, можно поискать должность помощника или стажировку в крупных IT-компаниях.

    Советы и книги для начинающих

    ТОП-5 рекомендаций от экспертов в Data Science для новичков:

    1. Получите качественное профильное образование, если хотите стать профессионалом и работать по специальности. Лучше выбрать одну из ведущих онлайн-школ – вы узнаете максимум полезной информации и закрепите знания на реальных практических кейсах.
    2. Изучайте учебники не только российских, но и зарубежных авторов. Направление относительно новое, поэтому обязательно нужно ознакомиться с работами западных специалистов.
    3. Учите технический английский – без него будет сложно разобраться в терминологии, документации и профессиональной литературе.
    4. Больше практикуйтесь. Например, на платформе Kaggle можно принять участие в соревнованиях среди Дата Сайентистов, а также посмотреть скрипты более опытных участников.
    5. Работайте над своим портфолио. К примеру, про­грам­мы ана­ли­за дан­ных мож­но пуб­ли­ко­вать на GitHub.

    Подборка полезных книг для начинающих специалистов по Дата Сайенс:

    • «Наука о данных», Б. Тирни, Д. Келлехер.
    • «Машинное обучение. Наука и искусство построения алгоритмов, которые извлекают знания из данных», П. Флах.
    • «Python и анализ данных», У. Маккинни.
    • «Работа с данными в любой сфере», К. Еременко.
    • «Вероятностное программирование на Python: байесовский вывод и алгоритмы», К. Дэвидсон-Пайлон.
    • «Big Data, Data Mining, and Machine Learning», J. Dean.
    • «Data Mining and Analysis: Fundamental Concepts and Algorithms», Mohammed J. Zaki, Wagner Meria Jr.

    Специалист по Data Science

    Сертифицированная программа национального проекта «Цифровая экономика». Изучение всех направлений современного анализа данных: от основ программирования и дискретной математики до машинного обучения, прикладной статистики, Big Data и не только.

    Расписание занятий: по понедельникам и средам (19:00 — 22:00)

    Подать заявку Задать вопрос

    • Старт курса 14.02.2024
    • Продолжительность 18 месяцев
    • Формат обучения Очный
    • Документ Диплом о профессиональной переподготовке НИУ ВШЭ

    О профессии

    Специалист по Data Science — тот, кто разрабатывает алгоритмы для работы с данными. Например, придумывает рекомендательную систему для музыкального сервиса, строит модель ценообразования для сети магазинов или создает бота-помощника.

    Наш курс по анализу данных и машинному обучению охватывает все разделы современной науки о данных, в том числе Deep Learning и его применение в технологиях искусственного интеллекта.

    Вы начнете с самых основ — изучения программирования и базовых разделов математики — и перейдете к теме Machine Learning, прикладной статистике и практическому использованию фреймворков для проведения распределительных операций неструктурированных данных. Получите опыт решения прикладных задач в области дата-анализа и обработки Big Data, сможете применять навыки дата-сайентиста в работе с изображениями, текстами, сигналами и нейросетями.

    По итогам обучения вы получите актуальные знания по Data Science, проекты в портфолио и диплом о профессиональной переподготовке установленного НИУ ВШЭ образца.

    «Специалист по Data Science» — Евгений Соколов о программе профессиональной переподготовки

    Для кого

    Очная программа «Специалист по Data Science» предназначена слушателям, желающим разобраться в анализе данных

    • Начинающим Изучите основы программирования, математики, машинного обучения и работы с Big Data
    • Специалистам не из IT Освоите новые методы и инструменты для работы с данными в своей области
    • Программистам Освежите в памяти алгоритмы и структуры данных и научитесь обучать нейронные сети

    Программа обучения

    За 18 месяцев профессиональной переподготовки в НИУ ВШЭ вы изучите Python и SQL, прикладную математику и статистику, алгоритмы и структуры данных, Machine Learning и другие темы

    Python для автоматизации и анализа данных 18 занятий

    • Введение в Python, Jupyter. Ввод-вывод, основные типы данных (int, float, str). Первые функции;
    • Логические переменные, операции и операторы сравнения. Условия if-elif-else. Условный цикл while. Списки, кортежи, последовательности;
    • Множества. Словари. Вложенные структуры данных. Методы строк, списков. Срезы;
    • Цикл for. Вложенный цикл for;
    • Функции. Рекурсия. О-нотация; Текстовые файлы и таблицы;
    • Регулярные выражения; Классы и основы ООП. Декораторы;
    • Телеграм-бот на Python. Работа с SQL и базами данных с помощью Python;
    • Введение в numpy. Работа с векторами и матрицами. Введение в pandas;
    • Pandas продолжение. Разведочный анализ данных (EDA);
    • Сбор данных: скрейпинг, requests, BeautifulSoup;
    • Сбор данных: requests, BeautifulSoup — продолжение;
    • Сбор данных: работа с сервисами через API;
    • Сбор данных: Selenium, работа с сервисами через API;
    • Визуализация для презентации данных: matplotlib, seaborn;
    • EDA особенности;
    • Предобработка текстов: лемматизация, удаление стоп-слов.

    SQL 5 занятий

    • Введение в базы данных. Обращение к базе данных. Типы данных. Фильтрация данных;
    • Агрегирующие функции. Функции работы с датами. Функции работы со строками;
    • Взаимоотношения между таблицами. Операторы JOIN и UNION;
    • Подзапросы и временные таблицы;
    • Оконные функции.

    Алгоритмы и структуры данных 10 занятий

    • Асимптотика. Нотация О-большое. Измерение времени работы программы;
    • Базовые структуры данных (список, стек, дек, очередь);
    • Базовые структуры данных (сет, мэп, хэш-таблицы);
    • Сортировки: итеративные, линейные, рекурсивные. Поиск;
    • Динамическое программирование;
    • Алгоритмы на строках. Сравнение строк. Расстояние редактирования;
    • Теория графов. Введение. Алгоритмы обхода графов;
    • Поиск кратчайших путей в графе;
    • Минимальное остовное дерево;
    • Эвристические и приближенные алгоритмы.

    Математика для анализа данных 19 занятий

    • Множества и логика;
    • Комбинаторика и вероятность;
    • Неориентированные графы;
    • Ориентированные графы и алгоритмы на графах.
    • Функции одной переменной, пределы, производные;
    • Касательные, критические точки, поиск минимумов и максимумов;
    • Интегралы, введение в вычисление интегралов;
    • Функции нескольких переменных, градиент, производная по направлению, линии уровня, касательная плоскости, критические точки, поиск минимумов и максимумов;
    • Оптимизационные задачи, лагранжиан и его геометрический смысл, нахождение минимума или максимума с заданными ограничениями.
    • Системы линейных уравнений, матрицы, обратимость и невырожденность;
    • Определитель, обратная матрица;
    • Векторные пространства и подпространства, размерности, ранги матриц;
    • Линейные отображения и их матричное описание. Собственные значения и векторы, связь со спектром;
    • Билинейные и квадратичные формы. Скалярные произведения, углы и расстояния. Ортогонализация и QR-разложение. Линейные многообразия и линейные классификаторы, отступы;
    • Операторы в евклидовых пространствах. Сингулярное разложение (SVD).
    • Пространство элементарных исходов. События. Вероятность и её свойства. Условная вероятность. Формула полной вероятности. Формула Байеса;
    • Дискретные случайные величины и их распределения. Независимость случайных величин. Распределение функции от дискретной случайной величины. Математическое ожидание и дисперсия;
    • Случайные величины, имеющие плотности. Математическое ожидание случайной величины, имеющей плотность. Равномерное, экспоненциальное, нормальное распределения;
    • Функция распределения. Распределение функции от случайной величины, имеющей плотность. Многомерные случайные величины. Ковариация и корреляция;
    • Условное распределение. Неравенства концентрации (неравенства Маркова и Чебышёва). Распределение суммы случайных величин. Закон больших чисел. Центральная предельная теорема. Неравенство Чернова.

    Прикладная статистика для машинного обучения 10 занятий

    • Основы теории вероятностей. Описательные статистики;
    • Взаимосвязи между случайными величинами. Взаимосвязи в данных;
    • Методы оценивания параметров распределения. Свойства статистических оценок;
    • Предельные теоремы. Асимптотические и точные доверительные интервалы;
    • Процедура проверки гипотез. Параметрические критерии;
    • Непараметрические критерии. Критерии согласия. Бутстрап, множественное тестирование;
    • Введение в А/Б тестирование: постановка задачи, особенности сбора данных, взаимосвязь размера выборки, уровня значимости, мощности теста и MDE. Особенности метрик;
    • Основные методы А/Б тестирования: стратификация, бакетное преобразование, линеаризация, CUPED;
    • Статистический взгляд на линейную регрессию;
    • Основы анализа временных рядов. Модель SARIMA и её подгонка.

    Машинное обучение 14 занятий

    • Введение в машинное обучение. Основные понятия. Типы задач;
    • Разбиение на train и test. Обучение и оценка качества модели;
    • Линейные методы регрессии. Функционал ошибки. Метрики качества. Переобучение;
    • Градиентный спуск; Регуляризация в линейной регрессии. Кросс-валидация. Кодирование категориальных признаков;
    • Линейные методы классификации (бинарная). Логистическая регрессия. Метрики качества;
    • SVM. Многоклассовая классификация;
    • Нелинейные методы классификации. Байесовский классификатор. KNN. Kernel SVM;
    • Деревья решений. Критерии информативности;
    • Ансамблевые методы. Случайный лес, бэггинг. Разложение ошибки на bias, variance;
    • Градиентный бустинг. XGBoost, CatBoost, LIghtGBM;
    • Обучение без учителя. Кластеризация и визуализация данных. Метрики качества;
    • Понижение размерности. PCA. Детектирование аномалий;
    • Рекомендательные системы;
    • Статистический взгляд на модели МО. Анализ временных рядов.

    Промышленное машинное обучение на Spark 8 занятий

    • Введение в Big Data: как работают и где находятся большие данные;
    • Среда Spark. Spark RDD / Spark SQL;
    • Advanced SQL;
    • Spark ML /Spark TimeSeries;
    • Advanced ML и проверка результатов качества моделей;
    • Spark GraphX /Spark Streaming;
    • Экосистема Spark (MLFlow, AirFlow,H2O AutoML);
    • Spark в архитектуре проекта / Spark CI/CD.

    Глубинное обучение 10 занятий

    • Введение в глубокое обучение. От линейной регрессии к нейронной сети. Смотрим на базовые возможности tensorflow/pytorch, собираем первую нейросеть;
    • Обучение нейронных сетей. Алгоритм обратного распространения ошибки;
    • Сверточные нейронные сети. Классификация изображений;
    • Оптимизация. Эвристики для обучения нейронных сетей. Нормализация по батчам, инициализация и другое;
    • Архитектуры сверточных сетей. Что видят сверточные сети. Transfer learning;
    • Обзор задач компьютерного зрения. Детекция, сегментация, перенос стиля, распознавание лиц;
    • Автокодировщики и генеративные модели (Generative Adversarial Networks);
    • Глубокое обучение для NLP. Векторные представления текстов: word2vec, fasttext;
    • Рекуррентные нейронные сети, работа с последовательностями. ELMO-эмбеддинг; Sequence-to-sequence, архитектуры с механизмом внимания. Трансформеры. BERT.

    Прикладные задачи анализа данных | онлайн с преподавателем 10 занятий

    • Введение в цифровую обработку сигналов и классификация звуков. Автоматическое распознавание речи;
    • Преобразование текста в речь;
    • Введение в обработку текстов и классификация текстов; Языковое моделирование;
    • Машинный перевод;
    • Распознавание лиц и метрическое обучение;
    • Семантическая сегментация изображений;
    • Детекция объектов на изображениях;
    • Глубинное обучение в производстве: обслуживание и ускорение.

    Финальный проект

    Формат обучения

    Продолжительность общая в часах: 714 часов

    Условия приема: высшее или среднее профессиональное образование; лица, получающие высшее образование

    Формат обучения: очный

    Состав группы: группа до 30 человек

    Результаты обучения

      РАЗБЕРЕТЕСЬ В НАПРАВЛЕНИЯХ DATA SCIENCE

    Изучите программирование на Python, математику для анализа данных, прикладную статистику, классические модели машинного обучения и нейронные сети, а также основы обработки текстов, звука и изображений

    Освоите SQL, Python, Jupyter Notebook, Spark, Tensorflow, Pytorch и другие инструменты

    Напишете чат-бота, программу для машинного обучения и защитите финальный проект. Это хорошая возможность пополнить портфолио, особенно для начинающих

    Получите самые актуальные знания по специальности и сможете работать специалистом по Data Science в крупных IT-компаниях

    Подать заявку Задать вопрос

    Преимущества программы

    • 01 В декабре 2019 г. обучающий курс «Специалист по Data Science» стал сертифицированной программой нацпроекта «Цифровая экономика» и победил в номинации «Подготовка профессионалов цифровой индустрии»
    • 02 Наши преподаватели работают в ведущих IT-корпорациях, банках и инновационных стартапах. На каждом занятии они учат применять теорию к реальным задачам, которые решают в индустрии
    • 03 Мы выкладываем видеозаписи и материалы занятий, доступ сохраняется за вами в течение 2 месяцев после завершения
    • 04 Вы можете общаться с другими студентами и преподавателями очно или в закрытом Telegram-канале. Доступ к чатам открыт навсегда — если у вас возникают вопросы, вы можете задать их даже после окончания обучения

    Документ об окончании

    Диплом о профессиональной переподготовке при успешном завершении обучения.

    У нас есть лицензия на образовательную деятельность.

    Подать заявку Задать вопрос

    Преподаватели

    Касьяненко Дарья Алексеевна

    Пиле Ян Эрнестович

    Кантонистова Елена Олеговна

    Карпов Максим Евгеньевич

    Максаев Артём

    Промыслов Валентин Валерьевич

    Горденко Мария Константиновна

    Мылзенова Дарима

    Ушакова Юлия

    Балдицын Владимир

    Хуракай Долма

    Матвеева Анна

    Колмагоров Евгений

    Соловей Владислав

    Паточенко Евгений

    Промыслов Платон

    Кириллова Екатерина

    Рахимов Руслан

    Овчинников Кирилл

    Находнов Максим

    Костоев Руслан

    Касьяненко Дарья Алексеевна

    • С 2023 года – эксперт, преподаватель Центра непрерывного образования факультета компьютерных наук.
    • С 2021 года ведет курсы на проекте Data Culture, направленного на внедрение курсов по анализу данных во все бакалаврские программы НИУ ВШЭ.
    • Бакалавр журналистики и магистр медиакоммуникаций НИУ ВШЭ.
    • В 2018-2023 годах работала менеджером проектов факультета коммуникаций, медиа и дизайна, где самостоятельно освоила Python и автоматизировала back office, слепое рецензирование и олимпиады.
    • 2020-2023 – старший преподаватель Института медиа: ведет курсы «Программирование на Python», «Обработка и автоматизация данных в Google таблицах», «Введение в открытые данные», «Sustainability and ICT (Information and Communication Technologies)».

    Пиле Ян Эрнестович

    • Строил скоринговые модели в банках (Тинькофф, ОТП БАнк, UniCredit); в рисках и маркетинге. Далее работал аналитиком в Яндекс.Маркете. С августа 2020 руководит группой аналитики в VK.
    • Принимает участие в разработке и доработке программ Центра непрерывного образования с 2020 года. Преподает Python и SQL для начинающих.
    • Закончил физфак МГУ. Сейчас продолжает занятия физикой в Лаборатории вычислительной физики МИЭМ НИУ ВШЭ.

    Кантонистова Елена Олеговна

    • Академический руководитель онлайн-магистратуры «Машинное обучение и высоконагруженные системы», Доцент
    • С 2016 года преподает на курсах по глубинному обучению открытых и корпоративных программ Центра непрерывного образования.
    • С 2020 года — академический руководитель онлайн-магистратуры «Машинное обучение и высоконагруженные системы» ФКН ВШЭ.
    • С 2016 по 2018 год работала на позиции Data Scientist в компании Raxel Telematics.
    • C 2017 по 2018 годы была консультантом в WorldQuant LLC.
    • С 2018 по 2019 год занимала должность ведущего Data Scientist’а в компании United Consulting Group.

    Карпов Максим Евгеньевич

    Cтарший преподаватель, младший научный сотрудник лаборатории LAMBDA

    • Преподаватель курсов по Python Центра непрерывного образования ФКН.
    • Имеет большой опыт преподавания программирования студентам непрофильных специальностей на проекте Data Culture. Ведет курсы «Анализ данных на Python», «Анализ данных в Excel», «Data Analysis in Politics and Journalism», «Machine Learning», «Основы глубинного обучения».
    • После специалитета по международным отношениям закончил магистратуру по наукам о данных.

    Максаев Артём

    Доцент, заместитель руководителя департамента больших данных и информационного поиска

    • Ведет блоки по линейной алгебре, математическому анализу и теории графов на открытых и корпоративных программах Центра непрерывного образования ФКН.
    • Преподавал в лицее «Вторая школа», Сириусе.

    Промыслов Валентин Валерьевич

    Старший преподаватель, академический руководитель онлайн-бакалавриата «Компьютерные науки и анализ данных»

    • Преподаватель дискретной математики курсов Центра непрерывного образования;
    • Ведет курсы по математическому анализу, линейной алгебре и теории вероятностей факультета компьютерных наук с 2019 года.
    • С 2022 года — академический руководитель онлайн-бакалавриата «Компьютерные науки и анализ данных».
    • Выпускник специалитета и аспирант механико-математического факультета МГУ.
    • С 2011 года преподавал математику школьникам.

    Горденко Мария Константиновна

    Академический руководитель магистратуры «Анализ данных в девелопменте»

    • С 2019 года — старший преподаватель факультета компьютерных наук НИУ ВШЭ.
    • Преподаватель открытых и корпоративных курсов Центра непрерывного образования по программированию на C#, Java, алгоритмам и структурам данных.
    • С 2023 года – академический руководитель магистерской программы «Анализ данных в девелопменте» НИУ ВШЭ.
    • С 2014 работала в международной лаборатории интеллектуальных систем и структурного анализа, где стала младшим научным сотрудником. С 2022 года – ведущий эксперт Института статистических исследований и экономики знаний НИУ ВШЭ.
    • Окончила бакалавриат и магистратуру ФКН по специальности «Программная инженерия». Продолжает обучение в аспирантуре факультета компьютерных наук.

    Мылзенова Дарима

    • С 2021 по 2023 год – инженер по исследованиям и разработке в Just AI
    • С 2018 по 2020 год — аналитик данных в компании Газпром Нефть.
    • С 2017 по 2018 работала на позиции аналитика данных в Департаменте информационных технологий города Москвы.
    • Выпускница мехмата МГУ им. М.В. Ломоносова и совместной магистратуры «Науки о данных» ФКН НИУ ВШЭ и Школы анализа данных Яндекса.
    • Разрабатывала программу и обучала машинному обучению студентов старших курсов в Digital Banana.

    Балдицын Владимир

    ML-разработчик в Яндексе. Ведет курсы по Прикладной статистике.

    Образование: Московский физико-технический институт, специальность «Информатика и вычислительная техника».

    Профессиональные интересы: машинное обучение, прикладная статистика, дискретная математика, когнитивные науки, лингвистика.

    Хуракай Долма

    С июня 2021 года – бизнес-аналитик в «Самокате». Работала бизнес-аналитиком в X5 Retail Group.Ведет курсы по математике.

    Образование:
    Российский университет дружбы народов, специальность «Бизнес-информатика»;
    Национальный исследовательский университет «Высшая школа экономики», специальность «Электронный бизнес».

    Профессиональные интересы: математика, анализ данных, продуктовая аналитика.

    Матвеева Анна

    В настоящее время – ведущий аналитик данных и дата-инженер в компании Деметра-Холдинг, направление деятельности – внедрении аналитики данных в сельскохозяйственном секторе.

    Профессиональный опыт: приглашенный преподаватель дисциплины «Базы данных» на факультете компьютерных наук НИУ ВШЭ в течение двух последних лет, опыт работы в качестве приглашенного преподавателя модуля «SQL» программы «Аналитик данных» центра непрерывного образования ФКН НИУ ВШЭ.

    Образование: выпускница бакалаврской программы двойного диплома «Прикладной анализ данных» ПМИ ФКН НИУ ВШЭ и UOL LSE, в настоящее время – обучение на магистерской программе «Анализ данных в девелопменте» ФКН НИУ ВШЭ.

    Колмагоров Евгений

    Работает разработчиком в команде поиска, где занимаемся задачами ранжирования ленты товаров и обработкой поисковых запросов.

    С 2020 по 2021 работал в Сбере на позиции инженера данных. С 2021 по 2023 — в Яндексе в качестве ML-разработчика.

    Окончил Московский государственный университет им. М.В. Ломоносова, факультет вычислительной математики и кибернетики.

    Промыслов Платон

    Преподаватель Центра непрерывного образования ФКН НИУ ВШЭ.

    Профессиональный опыт: работал преподавателем кружка по олимпиадной математике на Малом мехмате МГУ, с августа 2020 по январь 2021 года являлся HR-аналитиком в СПАО «Ингосстрах», с 2022 года – приглашенный преподаватель на программах Центра непрерывного образования ФКН НИУ ВШЭ, был инструктором курса «Введение в машинное обучение» в Фонде «Институт Вега», семинаристом курса «Теория вероятностей» пилотного и основного потоков ПМИ ФКН НИУ ВШЭ.

    Образование: механико-математический факультет МГУ им. М.В. Ломоносова.

    Рахимов Руслан

    Инженер-исследователь в Сколтехе. Лауреат премии им. И. Сегаловича. Ведет курсы по Прикладным задачам анализа данных.

    Образование: Московский физико-технический университет.

    Профессиональные интересы: нейронная визуализация, компьютерное зрение и глубинное обучение.

    Овчинников Кирилл

    Руководитель направления в Сбере. Ведет курсы по прикладным задачам анализа данных.

    Образование: Московский физико-технический институт, специальность «Прикладная математика и физика».

    Костоев Руслан

    Ведущий исследователь в Аiri.

    Работал в компаниях: Digital Petroleum, Google, Яндекс. Занимался исследованиями в Сколтехе и ИППИ РАН.

    Образование: ВМК МГУ им. М.В. Ломоносова, Школа анализа данных Яндекса, магистратура Сколковского института науки и технологий.

    Эксперты

    Соколов Евгений Андреевич

    Теванян Элен Арамовна

    Иосипой Леонид Сергеевич

    Пиле Ян Эрнестович

    Соколов Евгений Андреевич

    Научный руководитель Центра непрерывного образования ФКН, Доцент

    • С 2016 года работает в НИУ ВШЭ, где разработал и ведет курсы «Машинное обучение», «Основы глубинного обучения»; «Введение в анализ данных».
    • Академический руководитель бакалавриата «Прикладная математика и информатика». Ведущий эксперт проекта Data Culture, направленного на внедрение курсов по анализу данных во все бакалаврские программы ВШЭ.
    • Преподает корпоративным клиентам НИУ ВШЭ на курсах для специалистов и топ-менеджмента.
    • С 2014 по 2019 год работал в Яндексе, где руководил группой анализа неструктурированных данных Yandex Data Factory, а затем был руководителем группы качества рекомендаций в Яндекс.Дзене.
    • С 2019 года — консультант в Яндексе.

    Теванян Элен Арамовна

    Руководитель по машинному обучению в операциях, Сбермаркет

    • С 2019 года по 2023 работала в Х5 Retail Group: начинала в команде ad hoc со специализацией в A/B-тестах, руководила командой data scientist’ов продукта CVM TCX.
    • Занимала должность руководителя команды развития алгоритмов диспатча в Яндексе.
    • Ведет лекции и тренинги для руководителей и менеджеров организаций по Data Science и машинному обучению. Центра непрерывного образования факультета компьютерных наук.
    • Окончила бакалавриат факультета компьютерных наук НИУ ВШЭ по специальности «Прикладная математика и информатика» в 2015 году. В 2018 году получила магистерскую степень НИУ ВШЭ по направлению «Анализ данных в биологии и медицине».

    Иосипой Леонид Сергеевич

    Академический руководитель программ по математике Центра непрерывного образования ФКН

    • В 2021-2022 руководил направлением по исследованию данных в Sber AI Lab.
    • В 2018-2021 работал старшим научным сотрудником лаборатории HDI Lab.
    • Академический руководитель и преподаватель программ по математике Центра непрерывного образования ФКН.
    • Получил степень кандидата наук по математике в НИУ ВШЭ в 2021.

    Пиле Ян Эрнестович

    • Строил скоринговые модели в банках (Тинькофф, ОТП БАнк, UniCredit); в рисках и маркетинге. Далее работал аналитиком в Яндекс.Маркете. С августа 2020 руководит группой аналитики в VK.
    • Принимает участие в разработке и доработке программ Центра непрерывного образования с 2020 года. Преподает Python и SQL для начинающих.
    • Закончил физфак МГУ. Сейчас продолжает занятия физикой в Лаборатории вычислительной физики МИЭМ НИУ ВШЭ.

    Стоимость и условия

    58 125 ₽

    Или 465 000 ₽ за весь курс

    Скидки

    Как поступить на программу

    • 01 Оставить заявку на программу. В заявке важно указать актуальные номер и e-mail
    • 02 Подтвердить обучение на курсе. Менеджер свяжется с вами по указанным в заявке контактам, чтобы вы могли подтвердить участие в обучении
    • 03 Отправить сканкопии документов для зачисления (паспорт, снилс, диплом, справка из вуза, свидетельство о смене фамилии)
    • 04 Заключить договор. Менеджер отправит вам договор на ознакомление и ссылку на оплату, по которой нужно будет оплатить обучение
    • 05 Начать обучение. За несколько дней до начала обучения менеджер отправит организационное письмо со всей важной информацией о программе и ссылкой на чат в Telegram

    Отзывы выпускников

    Именно во время обучения в НИУ ВШЭ я сделал дипломный проект, который сейчас превратился в большое направление в Сбере. Тема диплома — «Применение машинного обучения для анализа бизнес-процессов банка». Сейчас, как исполнительный директор по исследованию данных, лидирую это направление.

    Уже в процессе работы я узнала об обработке естественных языков как о направлении Data Science. Решила пройти обучение, так как появилось желание понимать больше о том, как все устроено. Сейчас использую полученные навыки на прошлом месте работы — недавно стала руководителем отдела.

    После защиты диплома я перешел с позиции эксперта в нефтегазовой компании на позицию инженера-разработчика по интерпретации данных.

    Понравился удобный формат обучения: очные занятия с трансляцией онлайн. Можно подключиться из любой точки мира, экономить время на дороге, при необходимости можно посмотреть, пересмотреть занятия в записи. При этом всегда есть возможность задать вопросы преподавателям. Что важно: сбалансированы теория и практика. Пройденный материал осознаешь и закрепляешь через домашние задания, а домашние задания разбираются на факультативах.

    Когда я выбирал программу по Data Science, я изучил несколько вариантов в разных учебных заведениях Москвы. «Специалист по Data Science» во ВШЭ показалась мне наиболее полной: она включает в себя курс алгоритмов, дискретки, линала, теории вероятностей и матстата — все, что необходимо было освежить перед погружением в машинное обучение. Престиж университета тоже сыграл свою роль при выборе.

    Где проходят занятия?

    • Вы будете учиться в главном корпусе Вышки – на Покровском бульваре, в компьютерных классах.
    • На время обучения получите пластиковый пропуск с доступом во все корпуса ВШЭ. В любое время вы можете зайти в библиотеку, чтобы поучиться или поработать.
    • Можете приезжать на занятия в корпус, а можете подключаться по Zoom.

    FAQ

    Как я буду учиться?

    Вы будете учиться два раза в неделю в зависимости от расписания вашей группы. Также предусмотрены каникулы. Каждое занятие состоит из лекции и практики. Для закрепления материала выдаются домашние задания. Все занятия проходят в корпусе на Покровском бульваре, 11. И в качестве бонуса мы записываем их и отправляем видео в учебные чаты.

    Сколько часов в неделю мне нужно уделять учебе?

    Приготовьтесь уделять учебе больше 10 часов в неделю. Вместе с преподавателями вы будете учиться 6 часов, 2 занятия в неделю. До 10 часов в среднем может уходить на выполнение домашних заданий.
    Хорошая новость — у вас будут перерывы на каникулы.

    Программа для начинающих?

    Да, программа для начинающих. Однако потребуется много сил, времени и самоорганизованности, чтобы освоить материал. Наша команда преподавателей, ассистентов и менеджеров будут рядом.

    Почему я должен выбрать вашу программу?

    В наших программах в коротком формате упакован опыт бакалаврских и магистерских программ факультета компьютерных наук Вышки. Опираясь на наши знания об отрасли, мы дадим Вам необходимую базу, чтобы войти в профессию или перейти на новый уровень на вашей текущей работе. К тому же, большинство наши программы — очные. Это означает, что вы сможете еженедельно общаться с преподавателями, получать поддержку ассистентов и одногруппников, это поможет сохранять мотивацию. Обучаясь на наших курсах, вы получаете возможность интегрироваться в сообщество Вышки, общаться с нашими преподавателями и участвовать в мероприятиях факультета и университета: например, мы проводили «Ночь анализа данных», у нас регулярно проходят, школы по аналитике и Data Science, IT-лекторий и научный коллоквиум ФКН. У нас есть лицензия на образовательную деятельность, поэтому по результатам обучения мы выдаем удостоверения о повышении квалификации и дипломы о профессиональной переподготовке установленного в НИУ ВШЭ образца.

    Чем специалист по Data Science отличается от аналитика данных?

    Приведем пример. Менеджер интересуется, какие товары пользователи интернет-магазина покупают вместе, с этим вопросом он пойдет к продуктовому аналитику. Аналитик поможет выявить такие категории товаров и предложит идеи для прототипа системы рекомендаций. Для многих интернет-магазинов таких рекомендаций может оказаться достаточно, чтобы повысить средний чек. Но далее может возникнуть потребность автоматизировать рекомендации и построить модель. Этим уже займется специалист по Data Science. Еще больше об этом рассказал Сергей Юдин в интервью «Аналитик данных и data scientist: в чем отличие?»

    Если я студент, могу ли я поступить на программу «Специалист по Data Science»?

    Да, но диплом о профессиональной переподготовке можно получить только после окончания вуза при предоставлении диплома.

    Могу ли я заниматься на своем ноутбуке?

    Да, вы можете приходить со своим ноутбуком. Также можно использовать компьютеры университета — все занятия проходят в компьютерных классах.

    Что делать, если мне тяжело учиться?

    Мы понимаем, что программа сложная и не все можно спланировать. Если вы чувствуете, что не справляетесь с материалом, обратитесь за помощью к преподавателям и ассисстентам программы. Возможно, кто-то из учащихся столкнулся с той же проблемой и поможет ее решить вам. А если нужен перерыв, напишите менеджерам.

    Контакты

    • Основной адрес Москва, Покровский бульвар, 11
    • Телефон +7 (495) 623-21-65
    • Электронная почта cs-courses@hse.ru

    С 30 декабря 2023 по 8 января 2024 – выходные дни. На звонки и письма ответим в рабочее время с 9 января

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *