Кто такой Data Scientist, чем он занимается и сколько зарабатывает

Data Scientist — это специалист, который работает с данными компании: анализирует, ищет в них зависимости и на основе этой информации делает выводы.
Data Scientist создает алгоритмы, которые решают разные бизнес-задачи и улучшают процессы: показывают пользователям интересный контент и повышают их вовлеченность, предсказывают пики и падения продаж, повышают качество производства. Например, с помощью таких алгоритмов Data Scientist может:
- Предсказывать продажи, поведение покупателей и спрос на отдельные группы товаров для того, чтобы бизнес мог скорректировать стратегию или эффективнее управлять запасами.
- Анализировать поведение посетителей на сайте, чтобы улучшать маркетинговые кампании и делать ставку на наиболее интересный потребителю контент.
- Анализировать текстовые данные, чтобы выявлять тренды в соцсетях.
- Анализировать большие данные, чтобы выявлять закономерности и на их основе делать научные прогнозы или целые открытия, как в случае с нейросетью AlphaFold , которая смогла расшифровать механизм сворачивания белка.
Аналитик данных — с нуля до трудоустройства за 9 месяцев
- Постоянная поддержка от наставника и учебного центра
- Помощь с трудоустройством
- Готовое портфолио к концу обучения
- Практика с первого урока
Вы получите именно те инструменты и навыки, которые позволят вам найти работу
Где нужен Data Scientist
Дата-сайентист может найти работу практически в любой отрасли, где генерируется подходящая для обработки и анализа информация: данные о клиентах, научных или производственных процессах, цифры, метрики, статистика.
В банках такие специалисты создают модели банковского скоринга — именно они определяют, под какой процент вам одобрить ипотеку. В промышленности с помощью анализа данных предсказывают поломки оборудования, занимаются георазведкой и следят за безопасностью. В e-commerce и ретейле повышают продажи благодаря рекомендательным системам и персональным подборкам для покупателей.
Чаще всего таких экспертов нанимают в крупные компании или стартапы. Первые — потому, что Data Science требует немалого бюджета на сбор и анализ данных. Вторые — из-за того, что Data Science является частью инновационной идеи и может стать драйвером роста компании.
Какие задачи решает Data Scientist: разбираем на примере
Допустим, дата-сайентисту нужно построить модель для сотового оператора, чтобы находить абонентов в «группе риска» — тех, кто собирается отказаться от услуг или сменить тариф.
Для этого нужно:
Собрать данные
Это значит определить, есть ли выборка данных и целевая переменная — описание признака, который будет предсказывать модель. Например, если для выборки из 100 человек точно известно, кто отказался от услуг, а кто остался с оператором — переменная есть, и можно строить эффективную модель. Если же из 100 участников кто-то ушел, кто-то остался, но кто — неизвестно, модель может давать сбой.
Сбором данных обычно занимается ML-engineer или дата-инженер. Его задача — передать data scientist релевантные, подготовленные и очищенные данные.

Так выглядит тренировочный датасет в задании Мегафона на Kaggle – в нем представлены обезличенные данные по использованию абонентами различных телеком-услуг.
Важно не только понять, какие данные есть по каждому объекту, но и оценить их надежность. Например, в каждой выборке есть ложные данные, когда человек указал о себе неверную информацию: скажем, в графе возраст написал «900 лет».
Выбрать модель и подготовить данные
На этом этапе важно обеспечить качество информации, на которой будет обучаться модель. Без этого алгоритм может выдать неправильный, ошибочный результат. Подготовить данные – значит трансформировать в удобную форму, которая называется матрицей объектов и признаков. Она и выглядит как таблица со всеми признаками — атрибутами — обучающих данных.
Оценить результат
Один из ключевых этапов — когда аналитик data science на основе опыта, интуиции и профессиональных навыков решает, насколько эффективной получилась модель. Сможет ли она работать не на обучающих, а на реальных данных — или алгоритм переобучился, то есть «вызубрил» ответы для этой выборки и будет бесполезен при анализе новой информации.
Чем Data Scientist отличается от Data Analyst и Data Engineer
В задачах, требующих анализа данных, может участвовать не только Data Scientist, но и другие специалисты. Например, выше мы упомянули Data Engineer, который собирает и готовит данные для Data Scientist.
А еще есть Data Analyst — специалист, который анализирует и визуализирует данные, чтобы помогать руководителям бизнеса принимать решения.
На первый взгляд эти профессии похожи, их часто путают. Но в действительности это разные специалисты:
Data Engineer собирает и готовит данные для аналитиков и специалистов по Data Science. Он не обучает модели, но много программирует, работает с базами данных: выгружает оттуда информацию, обрабатывает и создает для них хранилища.
Data Scientist и Data Engineer часто работают в связке: один готовит данные, другой использует их для экспериментов с моделями. А вот Data Analyst решает совсем другие задачи: он изучает статистику, ищет инсайты — выводы на основе данных — и подбирает для них визуально понятную форму. Задача дата-аналитика — найти ответ на конкретный вопрос бизнеса. Например, предсказать, какие товары будут пользоваться спросом или определить, в какие направления работы компании стоит инвестировать, а какие, напротив, сократить.

Читайте также: Гид по профессии аналитик данных: кто это, чем занимается и сколько зарабатывает
Что нужно знать и уметь, чтобы стать Data Scientist
Такому специалисту нужно хорошо знать математику: линейную алгебру, теорию вероятности, статистику, математический анализ. Придется разобраться с теорией машинного обучения, овладеть базовыми навыками программирования на Python, изучить фреймворки для машинного и глубокого обучения, а также научиться работать с языком SQL, который позволяет получать информацию из баз данных.
Это — базовые необходимые знания для начинающего специалиста. От опытного data scientist ждут умения решать сложные задачи: строить высоконагруженные модели — такие, которые смогут запускаться, скажем, сотни раз в секунду для каждого отдельного клиента. Или предотвращать неочевидные ошибки, когда модель переобучается из-за того, что в обучающую выборку попало лишнее поле.
Такие навыки получаются только с опытом, поэтому, помимо теории, в Data Science очень важна практика. И здесь у профессии есть преимущество: набивать руку можно практически с начала обучения, участвуя в открытых конкурсах по машинному обучению. Например, самое известное сообщество специалистов по Data Science — платформа Kaggle, где есть много обучающих материалов, но главное — соревнования от компаний.

Одно из самых известных соревнований Kaggle — задача на построение модели, которая определит, кто из пассажиров Титаника выживет в катастрофе.
Участие, и тем более победа в таких соревнованиях — это готовое портфолио, которое можно показать заказчику, и реальный опыт решения ML-задач.
Kaggle и другие соревнования могут стать для начинающего Data Science трамплином из джуниор в сеньор-специалиста. Практический опыт можно получить «в боевых условиях» и, доказав свою способность решать сложные задачи, претендовать на более высокую позицию.
Сколько зарабатывает Data Scientist
Уровень зарплаты зависит от опыта специалиста, региона и размера компании. Ниже – примеры вакансий для Москвы.
Junior Data Scientist может зарабатывать до 100 тысяч рублей.

Специалист со средним опытом — от 170 до 250 тысяч рублей.

Head of Data Science с опытом более 6 лет и большим стеком технологий — от 300 тысяч рублей.

Плюсы и минусы работы Data Scientist
Плюсы
Востребованная профессия
По данным Всемирного экономического форума , Data Analysts & Scientists — лидеры списка самых актуальных профессий до 2025 года.

Высокая зарплата
У разработчиков и Data Science-специалистов сопоставимые гонорары: по данным из вакансий hh.ru на май 2023, мидл Data Scientist в среднем может претендовать на ту же зарплату, что и мидл Python-разработчик.
Динамичный карьерный рост
В Data Science проще с практическим опытом: можно решать задачи на конкурсах, участвовать в Kaggle или хакатонах, собирать портфолио и быстрее расти в карьере.
Интересная работа
DataScience — одна из самых молодых и динамично развивающихся отраслей. Здесь много интересного. Например, можно автоматизировать задачи и отрасли, развивать науку, прокачиваться в глубинном обучении — области, где искусственный интеллект решает очень сложные задачи.
Минусы
Высокий порог входа
Специалисты Data Scientist должны хорошо знать математику, теорию машинного обучения. А еще — постоянно учиться, чтобы успевать за инновациями в сфере AI, которая меняется буквально на глазах.
Непонимание со стороны бизнеса
Несмотря на то, что машинное обучение находит применение практически во всех сферах, есть много областей, где построение моделей неэффективно: нет достаточного количества данных или четкой целевой переменной. В этом случае от Data Scientist могут ждать невозможного или нагружать нерелевантными задачами.
Кто такой Data Scientist и как им стать — итоги
- Data scientist создает модели машинного обучения — математические алгоритмы, которые на основе большого количества информации ищут закономерности и делают прогнозы.
- Специалисты по данным или Data Scientists работают практически во всех отраслях и сферах, чаще всего — в крупных компаниях или стартапах.
- Чтобы стать Data scientist, нужно изучить теорию: повторить или углубить знания в математике, разобраться с теорией машинного обучения.
- Получить практический опыт можно на соревнованиях и открытых конкурсах — это шанс разобраться в тонкостях профессии, получить хороший опыт и стать востребованным специалистом.
Профессия «Аналитик данных»
- Изучите востребованную в каждой компании профессию и помогайте бизнесам расти и развиваться
- Научитесь собирать, обрабатывать, изучать и интерпретировать данные с помощью SQL и Google Sheets
- Освойте когортный анализ и визуализацию данных с помощью Superset и библиотек Python
Ни за что не становись Data Scientist’ом!
Cовет, который я даю, когда кто-то спрашивает меня, как стать Data Scientist’ом. Вместо этого, лучше стань программистом.

Сейчас очень многие рвутся стать специалистами по данным. Но в то время, как data science является, возможно, самой желанной профессией 21 века, обесценивается другая не менее полезная и высокооплачиваемая специальность — программист.
Я часто получаю сообщения от выпускников и людей, собирающихся поменять профессию, которые спрашивают меня о том, с чего начать изучение науки о данных. Вместо этого, я советую им стать программистами.
Имея опыт того и другого, я постараюсь убедить вас стать именно разработчиком программного обеспечения.
1. В области программирования больше рабочих мест
В программной инженерии на порядок больше рабочих мест по сравнению с наукой о данных.
Ниже приведено несколько снимков экрана после поиска в Google «специалист по данным» и «программист».


7616 рабочих мест в data science по сравнению с 53 8893 рабочими местами в программировании. Это рабочие места в США, но другие страны показали аналогичные результаты.
Согласно Glassdoor, специалисты по данным зарабатывают больше, но моя гипотеза также гласит, что работа в data science требует и больше знаний.


Тем не менее, если вам предложат зарплату 1 млн долларов в области искусственного интеллекта — соглашайтесь!)
2. Нет единого мнения, что означает «Data Science»
У руководства часто нет единого мнения о том, что означает наука о данных. Также опыт показывает, что, учитывая ограничения в бизнесе, у них нет возможности строго следовать структуре распределения ролей.
Это означает, что обязанности «data scientist’а» в разных компаниях сильно различаются.

Хотя идеальный спектр должностей между программистом и специалистом по данным может существовать, маловероятно, что он будет реализован на самом деле. Это особенно касается стартапов, создающих основу инфраструктуры.
Наемные кандидаты в конечном итоге работают над проблемами, которые на самом деле необходимо решать силами компании, а не силами сотрудника, который только что был принят на должность data scientist.

Один из смешных случаев среди коллег в данной области заключался в том, что многие специалисты по данным писали бэкэнд-код, как разработчики программного обеспечения. Я знаю и других data scientist’ов, которые сидели в Excel и ломали головы над финансовыми вопросами.
Это резко контрастирует с тем, что вы ожидаете, если вы выросли на соревнованиях Kaggle.
3. Изолированность Data Science
Большинству компаний не нужно столько специалистов по данным, сколько программистов. Другие компании только еще нанимают своего первого data scientist’а прямо сейчас.
По этой причине многие специалисты по данным работают в одиночку, даже если они сидят за одним столом с разработчиками.
Тут возникают сложности с получением обратной связи и мнения со стороны. Программисты либо не разбираются в прогнозном моделировании, либо слишком заняты работой над совершенно другими проблемами.
Напротив, одним из преимуществ наличия целой команды разработчиков является возможность сказать коллегам: «Я думаю, что мы должны внедрить ABC в XYZ. Что вы думаете на этот счет?»
Будьте готовы поговорить с самим собой . или с резиновой уткой (прим.пер. Метод тестирования ПО).
4. Data Science — это исследование
Будьте готовы к неловким разговорам с руководством о том, почему то, на что вы потратили 2 недели, не может быть использовано.
Работа над решенными и нерешенными проблемами — одно из фундаментальных отличий между разработкой программного обеспечения и ИИ.
Помимо ошибок и ограничений, вы уже знаете, возможно ли реализовать большинство проектов по разработке программного обеспечения еще до начала самой работы. Чего нельзя сказать о ML, когда вы не знаете, будет ли модель эффективной до тех пор, пока вы ее не построите.
5. Компании не готовы к AI
Даже в эпоху, когда каждая компания внедрила искусственный интеллект, у большинства из них нет инфраструктуры для ее поддержки.
Глава Data Science за чашечкой кофе недавно поделился советами для быстро растущего стартапа:
Сначала вы определяете проблему, затем создаете инфраструктуру и только потом привлекаете специалистов по данным. Это не быстрый процесс.
Еще один крупный специалист по Data Science в известной компании недавно высказался мне. Она была вынуждена обучать модели искусственного интеллекта на больших данных на своем ноутбуке, а не в облаке.
Если перед компанией не стоит специфичная проблема, которая решается только силами Data Science, или инфраструктура компании не подготовлена к решению таких вопросов, то вы, скорее всего, столкнетесь с трудностями, доказывая свою значимость, как специалиста.
6. Программирование учит общим навыкам
Стать младшим инженером-программистом — все равно, что получить степень MBA в области технологий. Вы узнаете всего понемногу.
Вы изучите базы данных, облачные технологии, развертывание, безопасность и написание чистого кода.
Вы научитесь создавать программное обеспечение, наблюдая за лидером отдела, старшим разработчиком или руководителем проекта.
Вы получите наставничество через обзоры кода.
Если вы окажетесь в компании с устоявшейся командой разработчиков, почти гарантировано, что вы быстро улучшите свои навыки и обретете колоссальный опыт.
7. Программная инженерия более передаваема
Предоставляя более комплексный опыт в области технологии, разработка программного обеспечения дает лучшие возможности выхода, когда вы решили, что пришло время перемен.
DevOps, безопасность, интерфейс, бэкэнд, распределенные системы, бизнес-аналитика, инженерия данных, наука о данных…
Я знаю ряд разработчиков, которые перешли от программирования к науке о данных. Если вы пробежитесь глазами по требованиям к специалисту в Data Science, то сразу заметите там массу требуемых навыков программиста:
- Опыт работы с SQL и Python, R или SAS;
- Знание AWS;
- Знание Linux;
- Знание экспериментального дизайна для бизнес-экспериментов;
- Знание систем DevOps, таких как GitLab;
Если вы можете создавать сквозные проекты, то вы также можете сделать как минимум модель для Kaggle. Вы можете взять эту модель, произвести ее, настроить авторизацию и Stripe, а затем начать взимать плату с пользователей за доступ. Это ваш собственный стартап.
Я бы никогда не стал утверждать, что наука о данных не подлежит передаче. Принятие решений на основе данных является по истине убойным навыком. Но это также становится чем-то большим, чем когда-либо, поскольку мы все больше ориентируемся на данные.
8. Машинное обучение станет инструментом для разработчиков программного обеспечения
По мере того, как ИИ становится удобнее и проще в использовании, разработчики программного обеспечения начинают использовать его для решения своих задач.
Я могу научить разработчика создавать классификаторы Sklearn. Это не значит, что он сможет построить следующий Alphago, но это дает ему альтернативу жестко запрограммированной условной логике, основанной на пользовательском вводе.
Data scientist’ы имеют специальные знания, такие как статистика и интуиция, о том, как работают модели. Но инженеры DevOps и Security также имеют свои специальные знания.
Я бы сказал, что они больше общие, чем разные. Опытный специалист по программному обеспечению может очень быстро перемещаться между специальностями.
Хотя я не думаю, что мы увидим полное слияние науки о данных с разработкой программного обеспечения, но похоже, что наука о данных может стать еще одной специальностью программирования.
9. AI не заменит программистов
Как бы глупо это ни звучало, я занялся разработкой программного обеспечения в 2014 году, потому что боялся, что ИИ изживет любую другую профессию.

Но дело в том, что внедрение технологий происходит медленно, а ИИ намного Уже, чем вы можете себе представить.
По сравнению с другими профессиями, машинное обучение очень далеко от автоматизации разработки программного обеспечения. Хотя у нас есть стартапы, создающие классные продукты, такие как автозавершение кода с поддержкой AI , написание кода — не специальность. Суть профессии все же заключается в решении задач с использованием технологий. А это то, что останется ценным и высокооплачиваемым навыком.
Заключение
Во-первых, это слегка нелепо. Во-вторых, я понимаю, что я объединил специалистов по данным, инженеров ML и исследователей ИИ. Но я думаю, что эти аргументы все же стоит рассмотреть, учитывая, что это ваша карьера.
Не воспринимайте это слишком серьезно. Я бы предпочел, чтобы вы прочли это и приняли собственное решение. Это часть того, чтобы стать data scientist’ом в конечном итоге 🙂
В конце концов, нам платят за решение проблем.
Что нужно знать, чтобы стать дата-сайентистом?

Принято говорить, что Data Science — это профессия будущего. Последние события показали, что это будущее уже наступило. Новые профессии должны быть связаны не только с открытиями в бизнесе и науке, но и обеспечивать независимость от внешних факторов, финансовую устойчивость, гибкость действий и пр. Дата-сайентисты высоко ценятся и быстро продвигаются по карьерной лестнице. Несмотря на кризис, в марте 2023 года на hh.ru по запросу «Data Scientist» можно найти более 280 вакансий в банковской сфере, логистике, телекоме и пр.
Профессия / 24 месяца
Data Scientist
Решайте амбициозные задачи с помощью нейросетей
5 491 ₽/мес 9 983 ₽/мес

Дата-сайентисты — это люди, которые умеют программировать, но не являются программистами. Они используют технологии искусственного интеллекта и создают модели машинного обучения (нейросети), которые помогают бизнесу анализировать информацию, делать выводы и моделировать картину будущего. Это сейчас актуально, как никогда.
Читайте также Кто такой Data Scientist и чем он занимается
- Data Science — прикладная область науки, в которой требуется хорошее знание математики: линейной алгебры, теории вероятности, статистики, математического анализа. Математические модели позволяют найти в данных закономерности и прогнозировать их значения в будущем. Но это не означает, что гуманитарий не сможет работать дата-сайентистом.
- Требуется знать современные языки программирования, для которых есть множество специализированных научных библиотек и компонентов для работы с Big Data. Для джуниор-специалиста достаточно знать Python и уметь работать с библиотеками вроде Numpy, Scikit, SciPy, Matplotlib и пр. Для специалистов более высокого уровня потребуется SQL, Java, C++ и другие.
- Важно знание предметной области (domain knowledge), в которой ведутся исследования. Дата-сайентисты схватывают все на лету. Например, если вы работаете над проектом по анализу банковских данных, но практически ничего не знаете про экономику, нужно обращаться к экспертизе других людей и постепенно накапливать знания.
- Чтобы войти в профессию, необходим английский язык. Большинство документации и книг написаны на английском и на русский не переводились. Это международный язык, на котором люди обмениваются знаниями.
Если вы хотите задать вопросы эксперту о том, как изменилась сфера IT, напишите их в комментариях под этим постом, в нашей группе во ВКонтакте или в Telegram-канале.
Эти ссылки отобраны для вас вручную:
Data Scientist
Дата-сайентисты решают поистине амбициозные задачи. Научитесь создавать искусственный интеллект, обучать нейронные сети, менять мир и при этом хорошо зарабатывать. Программа рассчитана на новичков и плавно введет вас в Data Science.
Кто такой Data Scientist и чем он занимается

Дата-сайентист (он же Data Scientist, специалист по Data Science) может найти себе работу в любой сфере: от розничной торговли до астрофизики. Потому что именно он — настоящий повелитель больших данных. Разбираемся, почему в современном мире всем так нужны дата-сайентисты и с чего начать.
Что делает Data Scientist
Data Scientist применяет методы науки о данных (Data Science) для больших объемов информации. Он строит и тестирует математические модели поведения. Это помогает найти в них закономерности или спрогнозировать будущие значения. Например, по информации о спросе на товары в прошлом специалист по работе с большими данными может спрогнозировать продажи в следующем году. Модели строят с помощью алгоритмов машинного обучения, а с базами данных работают через SQL. Пройдите наш тест и узнайте, какой вы Data Scientist. Ссылка в конце статьи.

Освойте профессию «Data Scientist» на курсе с МГУ
Data Scientist с нуля до PRO
Освойте профессию Data Scientist с нуля до уровня PRO на углубленном курсе совместно с академиком РАН из МГУ. Изучите продвинутую математику с азов, получите реальный опыт на практических проектах и начните работать удаленно из любой точки мира.

25 месяцев
Data Scientist с нуля до PRO
Создавайте ML-модели и работайте с нейронными сетями
6 224 ₽/мес 11 317 ₽/мес

Где нужен и какие задачи решает Data Scientist
- маркетологам поможет проанализировать данные карт лояльности и понять, каким группам клиентов что рекламировать;
- для логистов изучит информацию с GPS-трекеров и оптимизирует маршрут перевозок;
- HR-отделу поможет предсказать, кто из сотрудников скоро уволится, проанализировав их активность в течение рабочего дня;
- с продажниками спрогнозирует спрос на товар с учетом сезонности;
- юристам поможет распознать, что написано на документах, с помощью технологий оптического распознавания текстов;
- на производстве спрогнозирует срок службы оборудования на основе данных с датчиков.
В стартапах специалисты помогают разрабатывать технологии, которые выводят продукт на новый уровень: TikTok использует машинное обучение, чтобы рекомендовать контент, а MSQRD — технологии по распознаванию лица и искусственный интеллект.
Пример задачи
Если нужно спрогнозировать спрос на новую коллекцию кроссовок, то специалист:
- готовит данные о продажах кроссовок за последние несколько лет;
- выбирает модель машинного обучения, которая лучше всего подходит для прогноза;
- выбирает метрики, которые позволят оценить качество модели;
- пишет код модели;
- применяет алгоритм машинного обучения на данных о прошлых продажах;
- получает прогнозные значения и предлагает их менеджерам для принятия решения об объемах производства кроссовок.
Что ему нужно знать
Нужно хорошо понимать математику: линейную алгебру, теорию вероятности, статистику, математический анализ. Математические модели позволяют найти закономерности и прогнозировать их значения в будущем. А чтобы применять эти модели на практике, нужно программировать на Python, уметь работать с SQL и библиотеками (набор готовых функций, объектов и подпрограмм) и фреймворками для машинного обучения (например, NumPy и Scikit-learn). Для более сложных задач нужен язык С или C++.
Результаты анализа нужно уметь визуализировать, например, с помощью библиотек Seaborn, Plotly или Matplotlib.

Плюсы и минусы
Высокая зарплата — дата-сайентист приносит пользу бизнесу, за это готовы платить
Непредсказуемые результаты — нельзя понять, будет ли модель эффективной, до начала использования. Поэтому нужно быть терпеливым и готовым к неудачам, начинать с начала по нескольку раз
Влияние на бизнес — модели напрямую влияют на развитие компании и выручку
Дата-сайентисты часто работают в крупных интернет-компаниях, потому что те обладают огромными массивами данных. В таких компаниях результат работы специалиста сложно выделить среди результатов всего бизнеса
Востребованность — данных все больше, а на рынке дефицит кадров, многие крупные компании в поисках хороших кандидатов
Как выглядит рабочий день
Нужно ли работать в офисе, зависит от компании. На hh.ru можно найти около 25% вакансий удаленной работы. Иногда компании предлагают комбинировать работу из офиса и из дома. Взаимодействие с командой зависит от масштаба задач: новичок, готовящий данные к анализу, может общаться только с руководителем, а синьор должен общаться с заказчиками и делегировать задачи команде.
Как правило, рабочий день начинается с разбора почты и общения с командой. Затем нужно писать SQL-запросы и готовить массивы информации к машинному обучению, писать код модели на Python и прогонять данные через модель. В процессе работы нужно периодически созваниваться с командой и менеджерами, которые будут использовать модель на практике.

Станьте дата-сайентистом на курсе с МГУ и решайте амбициозные задачи с помощью нейросетей
Как Data Scientist строит карьеру
Ступени карьеры в Data Science, в целом, типичны для всей IT-отрасли.
- Джуниор нуждается в более детализированной постановке задач, его нужно направлять и объяснять, как решать некоторые задачи. Он готовит данные, очищает их от ошибок, делает простую обработку, строит сводные таблицы.
- Мидл может сам выполнить стандартные задачи, помощь ему нужна только в нестандартных ситуациях. Занимается машинным обучением и созданием алгоритмов.
- Синьор имеет несколько готовых проектов, может принять задачу от бизнеса и сам решить ее. Может обработать большие данные и визуализировать результаты, работает со сложными фреймворками.
Можно перейти в Chief Data Officer и управлять Data-проектами или выбрать специализацию, например обработку текста или изображений.
В каких случаях выбирают Data Science
- Когда нравится анализ и систематизация данных и есть интерес к передовым технологиям — дата-сайентисты работают с искусственным интеллектом, нейросетями и Big Data.
- Когда хочется заниматься исследованиями и наукой на качественно новом уровне.
- Когда есть опыт в обычной разработке и желание освоить набор инструментов, работать над масштабными проектами.
- Когда на текущей работе мало перспектив, хочется освоить перспективное направление и больше получать.

Глеб Синяков,
аналитик-разработчик в «Тинькофф»
Всех, кто приходит в Data Science, можно разделить на четыре потока. Есть те, кто становятся дата-сайентистами после профессионального образования, но в университетах таких курсов пока немного. Также есть люди технических и научных профессий, которые хотят найти более перспективную работу с большим окладом. Третий поток — разработчики, которые устают от скучного программирования и ищут интересные задачи. Есть специалисты, которые начинали с нуля: если у новичков есть самодисциплина и интерес к данным, то они будут хорошими дата-сайентистами. Наконец, есть те, к кому Data Science приходит сам, например к биоинформатикам.
Подробнее о том, что делает Глеб Синяков, читайте в статье.
Насколько это востребовано
По данным Всемирного экономического форума, Data Science занимает первое место в рейтинге профессий с самым большим спросом на рынке до 2025 года.
Data Science — одна из самых растущих профессий в IT, при этом специалистов компаниям не хватает. За последние три года количество вакансий выросло на 433%.
Сколько зарабатывает специалист по Data Science
Зарплата зависит от этапа карьеры и компании: у junior — 100 000 рублей, а у middle — более 280 000 рублей. Для сеньоров с большим стеком технологий и опытом от пяти лет есть вакансии и на 700 000 рублей.
По данным Хабр.Карьеры, средняя зарплата в Data Science — 170 000 рублей.

Отдельная перспективная опция — возможность работы в международных компаниях.
Какие качества пригодятся дата-сайентисту
- Коммуникабельность — общаться нужно много: принимать задачи и разбираться в них, общаться с командой, презентовать результаты заказчикам.
- Критическое мышление — умение задавать много вопросов окружающим и искать реальные, а не мнимые закономерности.
- Любознательность — нужно разбираться не только в своей сфере, но и в том, как работают бизнес-процессы, чтобы помочь компании вырасти.
Как стать специалистом по Data Science
Прежде всего стоит подготовиться к тому, что быстрого старта в IT не будет. Для Data Science нужна крепкая теоретическая база в математике, которую не выучить за три недели. Есть несколько вариантов получить необходимые знания.
Самостоятельное обучение. Способ подойдет тем, у кого уже есть опыт в IT, а также стальная воля для того, чтобы организовать свой учебный процесс и следовать ему. Начать изучение Data Science можно с учебника Dive into Deep Learning, затем освоить Python и SQL, например на бесплатных курсах или на YouTube. Чтобы погрузиться в среду и разобраться с современными задачами и подходами, полезно почитать кейсы на Хабре. После этого нужно много практиковаться и делать pet-проекты, чтобы получить опыт для своей первой работы или стажировки.
Онлайн-курс по Data Science. Подойдет тем, кто хочет освоить базовые знания на практике и передать организацию образовательного процесса в надежные руки. Обучение потребует от вас меньше усилий, вы будете работать над проектами под руководством кураторов-практиков. Минус способа — он не бесплатный. Зато быстрее, чем учиться самостоятельно.
Магистерская программа по Data Science. Это хороший способ получить фундаментальную и теоретическую подготовку от опытных преподавателей, а также практические навыки для реальных бизнес-задач. Такой гибридный формат обучения предлагает, например, онлайн-магистратура Skillfactory и МИФИ «Науки о данных». Здесь можно получить доступ к вычислительным ресурсам, библиотекам, а также к сообществу преподавателей и студентов.

Станьте дата-сайентистом: изучите науку о данных с преподавателями МИФИ и практикуйтесь на реальных кейсах
P.S.: Data Scientist — самая сексуальная профессия?
Этот расхожий мем запустил журнал Harvard Business Review, в котором в 2012 году была опубликована статья «Data Scientist — самая сексуальная профессия XXI века».
Текст начинается с рассказа о Джонатане Голдмане, выпускнике Стэнфорда, который устроился в LinkedIn и построил модель, предсказывавшую владельцу аккаунта, кто из пользователей соцсети может оказаться его знакомым. Эта разработка сильно ускорила рост LinkedIn и принесла ей новых пользователей.
В статье упоминается фраза Хэла Вариана, главного экономиста Google: «В ближайшие 10 лет самая сексуальная работа — это статистика. Люди думают, что я шучу, но кто бы мог подумать, что компьютерные инженеры окажутся самой сексуальной работой 90-х?».