Перейти к содержимому

Habr как стать data scientist

  • автор:

Как стать Data Scientist в 2019 году

Data Scientist — это эксперт по аналитическим данным, который обладает техническими навыками для решения сложных задач, а также любопытством, которое помогает эти задачи ставить. Эти специалисты несут основную ответственность за преобразование данных в Результативные идеи с помощью самостоятельно созданных прогностических моделей и специального анализа в соответствии с требованиями компании.

Другими словами, быть Data Scientist — чрезвычайно важная работа в нынешнем веке данных. Настолько, что статья в Harvard Business Review даже назвала ее (и это побуждает стать одним из них!).«Самой сексуальной работой 21-го века»(и это побуждает стать одним из них!).

И также не повредит тому, что работа Data Scientist очень хорошо окупается при средней зарплате 1022 тыс. в год. Именно поэтому эта статья является полным руководством для того, чтобы стать Data Scientist в 2019 году. Это дорожная карта, которой вы можете следовать, если хотите узнать больше о Data Science.

Но все еще существует большая путаница между различиями в роли Data Analyst и Data Scientist, поэтому мы начнем с этой статьи и перейдем к другим темам, таким как требования к образованию и требования к навыкам, чтобы стать специалистом в этой области.

Разница между Data Analyst и Data Scientist

Очевидно, что и у Data Analyst, и у Data Scientist есть описание работы, связанное с данными. Но какие между ними есть различия? Это вопрос, который возникает у многих людей относительно различий между этими специальностями. Так что давайте проясним это сомнение здесь!

Data Analyst использует данные для решения различных проблем и получения полезных данных для компании. Это делается с помощью различных инструментов на четко определенных наборах данных, чтобы ответить на корпоративные вопросы, такие как «Почему маркетинговая кампания более эффективна в определенных регионах» или «Почему продажи продукта сократились в текущем квартале» и так далее. Для этого основными навыками, которыми обладает аналитик данных, являются Data Mining, R, SQL, статистический анализ, анализ данных и т. д. Фактически, многие Data Analysts получают дополнительные необходимые навыки и становятся Data Scientists.

С другой стороны, Data Scientist может разрабатывать новые процессы и алгоритмы для моделирования данных, создавать прогностические модели и выполнять пользовательский анализ данных в соответствии с требованиями компании. Таким образом, основное отличие заключается в том, что Data Scientist может использовать тяжелое кодирование для проектирования процессов моделирования данных, а не использовать уже существующие для получения ответов из данных, таких как Data Analyst. Для этого основными навыками, которыми обладает Data Scientist, являются Data Mining, R, SQL, Машинное обучение, Hadoop, Статистический анализ, Анализ данных, OOPS и т. д. Таким образом, причина, по которой ученым Data платят больше, чем аналитикам Data, заключается в их высокой уровни квалификации в сочетании с высоким спросом и низким предложением.

Требования к образованию, чтобы стать Data Scientist

Существует много путей достижения вашей цели, но имейте в виду, что большинство из этих путей проходят через колледж, поскольку четырехлетняя степень бакалавра является минимальным требованием.

Самый прямой путь заключается в том, что вы получаете степень бакалавра в области Data Science, поскольку она, несомненно, научит вас навыкам, необходимым для сбора, анализа и интерпретации больших объемов данных. Вы узнаете все о статистике, методах анализа, языках программирования и т. д.,, которые только помогут в вашей работе в качестве Data Scientist.

Другой обходной путь, который вы можете выбрать, — это получить любую техническую степень, которая поможет вам в роли Data Scientist. Некоторые из них — компьютерные науки, статистика, математика, экономика. После получения степени вы будете иметь навыки кодирования, обработки данных, количественного решения проблем. Которые можно применять в Data Science. Затем вы можете найти работу начального уровня или получить степень магистра и доктора наук для более специализированных знаний.

Требования к навыкам, чтобы стать Data Scientist

Для Data Scientist требуется несколько навыков, охватывающих различные области. Большинство из них упоминаются ниже:

1. Статистический анализ. Как специалист по обработке данных, ваша основная задача — собирать, анализировать и интерпретировать большие объемы данных и создавать полезные для компании идеи. Очевидно, что статистический анализ является большой частью описания работы.
Это означает, что вы должны быть знакомы хотя бы с основами статистического анализа, включая статистические тесты, распределения, линейную регрессию, теорию вероятностей, оценки максимального правдоподобия и т. д. И этого недостаточно! Немало важно иметь понятие о том, какие статистические методы являются подходящим подходом для данной проблемы данных, еще важнее понять, какие из них не являются. Кроме того, есть много аналитических инструментов, которые очень полезны в статистическом анализе для Data Scientist. Наиболее популярными из них являются SAS, Hadoop, Spark, Hive, Pig. Поэтому важно, чтобы вы хорошо их знали.

2. Навыки программирования. Навыки программирования являются необходимым инструментом в вашем арсенале. Это потому, что намного легче изучать и понимать данные, чтобы делать полезные выводы, если вы можете использовать определенные алгоритмы в соответствии со своими потребностями.

В общем, Python и R являются наиболее часто используемыми языками для этой цели. Python используется из-за его способности к статистическому анализу и его удобству к прочтению. Python также имеет различные пакеты для машинного обучения, визуализации данных, анализа данных и т. д. (Например, Scikit-learn), которые делают его подходящим для науки о данных. R также позволяет очень легко решить практически любую проблему в Data Science с помощью таких пакетов, как e1071, rpart и многих других.

3. Машинное обучение. Если вы каким-либо образом связаны с технологической отраслью, скорее всего, вы слышали о машинном обучении. Это в основном позволяет машинам изучать задачи из опыта, не программируя их специально. Это делается путем обучения машин с использованием различных моделей машинного обучения с использованием данных и различных алгоритмов.

Таким образом, вы должны быть знакомы с алгоритмами контролируемого и неконтролируемого обучения в машинном обучении, такими как Линейная регрессия, Логистическая регрессия, Кластеризация K-средних, Дерево решений, Ближайший сосед и прочее. К счастью, большинство алгоритмов машинного обучения могут быть реализованы с использованием R или Библиотеки Python (упомянутые выше), Поэтому вам не нужно быть экспертом по ним. В чем вы нуждаетесь, это в умении понять, какой алгоритм требуется, основываясь на типе данных, которые у вас есть, и на задаче, которую вы пытаетесь автоматизировать.

4. Управление данными и обработка данных. Данные играют большую роль в жизни Data Scientist. Таким образом, вы должны быть опытными в управлении данными, которое включает извлечение, преобразование и загрузку данных. Это означает, что вам нужно извлечь данные из различных источников, затем преобразовать их в необходимый формат для анализа и, наконец, загрузить их в хранилище данных. Для обработки этих данных существуют различные платформы, такие как Hadoop, Spark.

Теперь, когда вы завершили процесс управления данными, вы также должны быть знакомы с обработкой данных. Обработка данных — это в основном означает, что данные в хранилище должны быть очищены и унифицированы согласованным образом, прежде чем их можно будет проанализировать для получения каких-либо действенных данных.

5. Интуиция данных. Не стоит недооценивать силу интуиции данных. Фактически, это основной нетехнический навык, который отличает Data Scientist от Data Analyst. Интуиция данных в основном включает в себя поиск шаблонов в данных там, где их нет. Это почти то же самое, что найти иголку в стоге сена, которая является реальным потенциалом в огромной неисследованной куче данных.

Интуиция данных — это не тот навык, которому можно так просто научиться. Скорее это происходит из опыта и продолжающейся практики. А это, в свою очередь, делает вас гораздо более эффективным и ценным в своей роли Data Scientist.

6. Навыки общения.Вы должны хорошо владеть навыками общения, чтобы стать экспертом в области Data Scientist. Это потому, что, хоть вы и понимаете данные лучше, чем кто-либо другой, вам необходимо преобразовать полученные данные в количественную оценку, чтобы нетехническая команда смогла принять решение.

Это также может включать data storytelling! Таким образом, вы должны иметь возможность представлять свои данные в формате повествования с конкретными результатами и значениями, чтобы другие люди могли понять, что вы говорите. Это связано с тем, что в конечном итоге анализ данных становится менее важным, чем практические выводы, которые можно получить из данных, что, в свою очередь, приведет к росту бизнеса.

  • data scientist
  • data science
  • data
  • machine learning
  • Программирование
  • Машинное обучение
  • Искусственный интеллект

Работа в Data Science: что важно знать и как этому научиться

Сегодня словосочетания вроде Data Science, Machine Learning, Artificial Intelligence очень популярны. При этом нередко под ними понимаются довольно разные вещи. Это зачастую смущает и запутывает людей, желающих войти в специальность: трудно разобраться, с чего начать, что действительно нужно, а что необязательно для начала. Не претендуя на общность, расскажем, как это видится на основе десятка лет опыта c решением такого рода задач для крупных клиентов со всего мира (сервис / заказная разработка / аутсорс – подставьте термин по вкусу).

Источник: https://timoelliott.com/blog/quick-somebody-find-me-a-data-scientist-jpg

Data scientist – кто такой, что умеет?

В наших реалиях data scientist – это человек, решающий бизнес-проблемы заказчика, опираясь на нетривиальные манипуляции с данными. Такая работа требует различных навыков, которые можно примерно разделить на три большие группы:

  • Математика и машинное обучение
  • Soft skills: коммуникация, презентация, английский
  • Технические: программирование, базы данных, облачные технологии и т.п.

Конечно, необходимо погружаться и в предметную область, но в каждом проекте она своя, поэтому абстракная подготовка вряд ли имеет смысл. Есть и общие для бизнеса соображения, которыми важно овладеть, хотя для начального уровня это менее актуально.

«А может, сразу к сеточкам?»

Обычно начинающие больше внимания уделяют машинному обучению и особенно нейронным сетям, что вполне объяснимо: эти области кажутся более «крутыми» и привлекательными. Ну и, конечно, делать что-то прикольное (например, отличать тех же котиков от собачек, хоть бы и по шаблону) намного веселее, чем разбираться с основами. Тем более, что доступность инструментов, решений и примеров создает впечатление, что задачи решаются достаточно легко, надо лишь найти подходящий образец. Такой подход (грубо говоря, copy-paste) вполне возможен и даже работает, пока не перестаёт. А вот чтобы понять, что сломалось и как чинить (не говоря уже о создании чего-то нового), требуется фундаментальное понимание идей и механизмов, основанное на математической базе.

Матан и его друзья

Необходимый минимум математических знаний выглядит вполне посильно:

  • Начала анализа: пределы, дифференцирование, интегрирование (без фанатизма)
  • Линейная алгебра: операции над матрицами, ранг, определитель, собственные вектора и значения, сингулярное разложение
  • Вероятность и статистика: случайные величины и их распределения, характеристики распределений, условная вероятность и формула Байеса, предельные теоремы, основные понятия статистики, оценка параметров и проверка статистических гипотез

Конечно, это лишь базовые темы, более глубокие и/или широкие знания будут полезны, но для старта хватит и этого.

«Что, еще и кодить?»

Ещё более недооценённым навыком для data scientist кажется программирование. Распространено мнение, что анализ данных и построение моделей сводятся к библиотечным вызовам, для которых особой квалификации не нужно. Наш опыт эту точку зрения не подтверждает: даже для достаточно типичных задач большая часть работы – это манипуляции с данными (зачастую весьма нетривиальные), что уж говорить о нестандартных проблемах.

Если переходить к конкретным языкам, это, конечно, в первую очередь Python. R в наши дни все же достаточно нишевый инструмент, MATLAB – тем более. Julia пока что не слишком популярная штука. Где-то можно встретить Java, C++ или Lua, но это, скорее, исключения.

«Python? Там же все понятно!»

Следует отметить, что Python при всей своей простоте всё же требует определенных знаний и навыков, чтобы писать хороший идиоматичный код и избегать подводных камней. Понимание алгоритмов и структур данных тем полезнее, чем более нестандартные задачи вы решаете. Ну и, разумеется, необходим собственно навык программирования (способность быстро преобразовать идею в грамотный код).

Из питоновских библиотек в обязательную программу входят numpy и pandas. Там тоже хватает нюансов для вдумчивого освоения (особенно если данных становится побольше, а трансформации – позатейливее).

Источник: https://xkcd.com/2054/

«И это еще не все?»

Само собой, важных технических областей намного больше. В некоторых проектах необходимо знание SQL (и вообще навык программирования в декларативной парадигме много где может пригодиться). Облачные вычисления давно уже норма, а не экзотика. Да и Big Data – это не просто модное словосочетание, а вполне востребованный комплекс технологий (если говорить о конкретных инструментах, это чаще всего Spark). Если есть время и желание, изучить все это будет полезно, но начинать работать можно и просто с устойчивым навыком программирования на Python (плюс numpy/pandas, конечно).

«Но теперь-то уже к сеточкам, правда?»

Что касается машинного обучения, сейчас многие сразу принимаются за нейронные сети. Это возможный подход, да и само по себе глубокое обучение практически незаменимо в работе с текстами или изображениями. Однако базовые вещи эффективнее разбирать на более простых моделях. Важно хорошо понять, что из себя представляет собственно задача обучения, переобучение и методы борьбы с ним, способы оценки предсказаний. Ну и, конечно, разобраться с классическими подходами: kNN, линейными моделями, деревьями и их ансамблями, а также методами кластеризации и понижения размерности. Этого уже будет достаточно для решения целого ряда задач (тем более, что на практике нейронные сети нечасто показывают лучший результат на структурированных данных, требуя при этом радикально больше ресурсов).

Источник: https://www.meme-arsenal.com/create/meme/6070052

Это отнюдь не значит, что глубокое обучение вредно для начинающих. Проблема в том, что часто люди начинают разбрасываться, перебирая модные архитектуры, при этом толком их не понимая (что естественно при нехватке фундаментальных знаний). Конечно, основательное и последовательное освоение предмета будет очень полезно, но на это, увы, мало у кого хватает времени и дисциплины.

«А вот я еще слышал про. »

Есть немало других тем (например, исследование операций, рекомендательные системы, ассоциативные правила и т.д.), которые необходимы в соответствующих задачах, а также достаточно интересны и поучительны сами по себе, но для старта как правило необязательны.

Ну и, last but not least, то, про что нередко забывают вообще: навыки коммуникации, визуализации и презентации. Важно понимать, что работы с людьми в этой профессии лишь немногим меньше, чем с данными, и объяснить результат зачастую не менее важно, чем его получить. Само собой, поскольку многие заказчики по-русски не понимают, английским надо владеть на достаточном уровне.

Источник: https://timoelliott.com/blog/2016/02/cartoon-data-story-telling.html

«Мыши, станьте ежиками!»

Все и сразу?

Многих привлекает идея получить нужные знания и навыки «пакетом» записавшись на курсы по data science. Увы, не все из них одинаково полезны. Условно курсы можно разделить на три группы:

  1. Где компании зарабатывают на учащихся
  2. Где компании ищут себе сотрудников
  3. Общественные активности

Как правило, во втором случае обучение будет заметно серьезнее (хотя и отбор строже).

Иногда спрашивают и об университетских программах (благо, сейчас несложно найти варианты удаленного обучения как на русском, так и на английском). Безусловно, надо внимательно смотреть на каждый конкретный случай, но в целом это скорее имеет смысл, если по каким-то причинам важен именно диплом. В наше время бесплатно доступны материалы ведущих мировых университетов (уровня Stanford и MIT), так что если в приоритете собственно знания, можно как минимум не хуже подготовиться самостоятельно (конечно, при наличии достаточной мотивации и самодисциплины). Для многих работодателей «корочки» глубоко вторичны: если человек знает и умеет то, что нужно в работе, какая разница, что он заканчивал? Ну а если нет – тем более. Конечно, сертификат Stanford Graduate Program может вызывать уважение, но если вы действительно к такому готовы, непонятно, зачем вы досюда дочитали.

Также надо понимать, что практически никакой курс сам по себе не гарантирует вам реальной квалификации и успешного трудоустройства (доводилось встречать людей, которым и ШАД не впрок, и полученная в западноевропейском ВУЗе степень PhD не помогает).

Как есть слона

Для тех, кто готов осваивать нужные темы самостоятельно, порекомендуем некоторые материалы. Конечно, список этот далеко не полон, и если вам нравится что-то другое – отлично, при условии, что это дает вам необходимые знания и навыки. Все ресурсы на английском (если вам трудно их воспринимать, значит в первую очередь нужно подтягивать язык – это заметно дольше и сложнее, чем разобраться с нейронными сетями). Какие-то из них есть и в переводе, но не всегда можно быть уверенным в его качестве. Ну и, естественно, владение англоязычной терминологией очень поможет в чтении статей, когда доберетесь от классических вещей до переднего края прогресса.

Кодил, кожу и буду кодить

Хрестоматийной книгой по Python считается Learning Python, хотя, конечно, с выхода последнего издания утекло много воды. Те, кто уже знаком с основами языка, могут предпочесть что-то вроде Clean Python. Если с программированием как таковым опыта немного, важно набить руку (например, на сайтах вроде https://www.hackerrank.com/, https://leetcode.com/, https://exercism.org/ и т.п.).

По numpy и pandas очень достойно выглядит книга «от создателей»: Python for Data Analysis. Потренироваться можно тут: https://github.com/guipsamora/pandas_exercises.

Если замахнетесь на алгоритмы и структуры данных, очень неплох курс Принстонского университета (правда, на Java, хотя освоение этого языка в достаточном для курса объеме не должно занять много времени): https://www.coursera.org/learn/algorithms-part1. Кому лучше заходят книжки, может прочитать первые пять глав из Grokking Algorithms. Есть материалы и для Питона: https://runestone.academy/runestone/books/published/pythonds/index.html. Однако в любом случае эта область кажется менее приоритетной (то есть, наличие знаний по теме будет полезно, но отсутствие вряд ли окажется решающим, если в остальном всё хорошо).

«Сколько выучить формул?»

Говоря о математической базе, стоит начать с линейной алгебры. Базовые представления можно получить тут: https://programmathically.com/linear-algebra-for-machine-learning/. Если захочется чуть углубиться, подойдут первые семь глав из книги No Bullshit Guide to Linear Algebra.

Источник: https://mathwithbaddrawings.com/2018/03/07/matrix-jokes/

Не менее важны основы анализа. Для начала хватит вот этого: https://programmathically.com/calculus-for-machine-learning/. Желающим разобраться, почему и как, можно порекомендовать книгу Calculus Made Easy.

Для знакомства с теорией вероятностей и математической статистикой достаточно будет следущих материалов: https://programmathically.com/probability-and-statistics-for-machine-learning-and-data-science/. Наглядно некоторые вопросы разобраны тут: https://seeing-theory.brown.edu/.

Если вам ближе ваши университетские конспекты – замечательно, только стоит убедиться, что все упомянутые выше темы ими охвачены.

Источник: https://xkcd.com/552/

Важно, чтобы на выходе было глубокое понимание базовых вещей. В порядке самопроверки можно попробовать не глядя в материалы объяснить себе или другому, что там и, главное, почему. Так, например, намного лучше не помнить навскидку формулу Байеса, но при этом быть в состоянии её вывести, чем наоборот.

Ng or not Ng?

Вводных материалов по машинному обучению много. Для понимания базовых идей и подходов очень хорош стэнфордский Statistical Learning (тут можно найти и книгу, и видеокурс: https://www.statlearning.com/). Единственный существенный минус – практические задания на R (есть смысл делать их на Python – как раз хорошее упражнение получится). Какое-то время был очень популярен Эндрю Ын (Andrew Ng) со своим Machine Learning. Содержание актуально до сих пор, а в обновленной версии курса MATLAB / Octave заменили на Python. Также можно отметить очень подробное объяснение базовых вещей, что для условных гуманитариев несомненный плюс, а вот людям с математической подготовкой может показаться избыточным.

Переходя от идей и подходов к их актуальной реализации, полезно проработать книгу Hands-On Machine Learning with Scikit-Learn, Keras, and TensorFlow. Для начала можно ограничиться первой частью, но упражнения пропускать не стоит.

Для закрепления навыков хорошо подойдет mlcourse.ai (в первую очередь именно как набор практических задач).

Если решите охватить и нейронные сети, можно начать с Deep Learning Specialization от того же Ына. Но, повторимся, лучше более основательно освоить классические методы.

Практика на Kaggle тоже будет полезна. Представляется разумным выбирать соревнования со структурированными данные не слишком большого объема, чтобы поменьше отвлекаться на технические сложности. Tabular Playground Series – отличный вариант для начала.

Хотя, безусловно, целый ряд важных в работе аспектов Kaggle не покрывает. Если интересно получить о них представление, можно почитать книги, освещающие вопросы бизнеса и коммуникации, например, Data Science for Business и Storytelling with Data. Однако для начального уровня это, скорее, факультативные вещи.

Источник: https://timoelliott.com/blog/2016/02/cartoon-data-story-telling.html

«А вдруг это не мое?»

В заключение хотелось бы отметить, что связанные с data science проекты подразумевают целый спектр ролей, а не просто условных data scientists. Так, например, востребованы data BA и data DM (бизнес-аналитики и менеджеры с глубоким пониманием специфики работы с данными и машинным обучением), data QA (тестирование различных аспектов обработки данных, включая и прогнозные модели), ML engineer («продукционализация» запрототипированных решений), MLOps (тут вообще можно встретить широкое разнообразие трактовок) и т.д. Так что если по ходу освоения предложенных материалов вам заметно более привлекательной покажется какая-то конкретная область, это не значит, что data science не для вас. Скорее, наоборот: есть неплохие шансы найти интересную вам нишу, особенно в крупных компаниях / проектах.

Источник: https://me.me/i/i-know-machine-learning-83cc8d4b173a47a3991085f3146cc360

Успехов вам в выборе целей и их достижении!

  • data science
  • machine learning
  • artificial intelligence
  • career
  • self-education

Ничего не понятно, но очень интересно: как начать карьеру в Data Science без профильного образования

Считается, что Data Science — это очень сложное направление, в котором обязательно нужны математические знания и техническое образование. Это верно только отчасти: внутри Data Science есть сайентисты, аналитики и инженеры. У них разные задачи и им нужен разный бэкграунд. О том, на кого легче выучиться гуманитарию, что нужно знать, чтобы войти в новую специальность и можно ли стать хорошим аналитиком данных без профильного опыта, рассказывает преподаватель GeekBrains, Data Analyst с уклоном в Data Engineering Никита Васильев.

В Data-Science (по крайней мере, в крупных компаниях) работают не только Data-сайентисты, но и аналитики с инженерами. Это разные профессии, для которых нужны разные знания и навыки. Например, если банку нужно определить, какой клиент вернёт кредит, а какой нет, аналитик найдёт источники данных для анализа. Он исследует их доступность, а результаты передаст инженеру. Тот обработает эти данные для сайентиста, приведёт их в нужный вид и формат. Сайентист, в свою очередь, будет решать задачи бизнеса. Получив данные от инженера, он переведёт их на математический язык и найдёт метрику для измерения проблемы. Именно этот специалист может посчитать, с какой вероятностью клиент вернёт кредит, построив модель из данных. После этого сайентист передает её обратно аналитику. Тот с помощью AB-тестов и других методов оценит эффективность модели и её статистическую значимость, а в конце проекта аналитик визуализирует полученные данные в виде графика или других наглядных материалов. Он презентует результат руководству и объяснит свои выводы.

Что нужно знать аналитикам, инженерам и сайентистам

Из этих трех профессий в Data Science углублённо разбираться в математике должен только сайентист. Data-инженеру достаточно школьной базы, но нужно знать программирование и фреймворки, уметь читать документацию. Ещё не помешает владение понятиями нормального распределения, отклонения, понимать теорию вероятности на очень базовом уровне и знать основы статистики. Иногда людям кажется, что это скучная профессия, но если вы любите читать, изучать документацию, то Data-инженер — очень интересная специальность.

Data-аналитику важнее всего софт-скиллы — разговорные навыки, умение вести документацию и процессы в Jira. Этот специалист делает вспомогательную работу в Data Science, поэтому на базовом уровне ему тоже стоит понимать теорию вероятности и статистику. Но на работе эти знания ему могут и не пригодиться. Всё зависит от специфики компании, в которую он устроится. Но точно понадобится понимание бизнеса, того, как там всё устроено, какие есть боли, задачи и проблемы.

Data Scientist действительно должен хорошо разбираться в математике: чтобы строить модели, нужно понимать, как они работают. Например, он должен знать, чем можно пренебречь, чтобы модель построилась быстрее, как её использовать и подать данные. Работать с ними, как с черным ящиком — нельзя.

Некоторые думают, что Искусственный интеллект — это отдельное направление, специальность внутри Data Science. На самом деле, это просто определенные алгоритмы, которые в него заложены. Сайентист получает модель в результате их применения. Если модель умеет предсказывать какое-то значение, расшифровывать речь, вести диалог или распознавать изображение — это и есть искусственный интеллект.

ИИ занимаются специалисты по компьютерному зрению и обработке естественного языка (Natural Language Processing). Требования к этим специалистам аналогичны тем, что предъявляются к сайентистам, но вдобавок нужны знания про направление, которым они занимаются. Тем, кто занимается компьютерным зрением важно понимать, как работают алгоритмы по распознаванию видео и картинок, владеть С++. Специалисты по NLP должны знать Python.

Как учиться на Data Science

Стать специалистом в Data Science можно с любым (даже гуманитарным) бэкграундом, было бы желание. Моя сестра — студентка, учится на социолога. Сейчас она проходит курсы по SQL и Python, хочет стать аналитиком данных. Я ей рассказываю что нужно знать, на каком уровне и зачем. Она отлично справляется.

Глубокие знания статистики или теории вероятности потребуются далеко не всем: это зависит от компании. Аналитики ищут источники, находят данные, соединяют их, а затем передают заказчику. Это львиная часть их работы. Вторая часть — умение разговаривать с коллегами. Никакая математика здесь не нужна, главное — научиться пользоваться языком запросов для БД. Достаточно понять логику и уметь правильно её описать.

Самостоятельно овладеть профессией из Data Science сложно. Нужно много работы, практики, придётся потратить массу времени. Курсы позволяют сделать это гораздо проще и быстрее, так как есть готовая программа, наставник, который отвечает на вопросы, помогает и даёт обратную связь.

Проблема самостоятельного обучения — обилие источников, часто слишком сложных или ошибочных. Обычно в профессиональной литературе публикуют информацию не для новичков, а для людей с опытом. В ней будет много терминов и слишком глубокое погружение в область. У меня так было с первым учебником: я его открыл и вообще ничего не понял. Продирался через дебри неизвестной мне терминологии — «бустинг», «линейная регрессия». Начинаешь читать — куча слов, значения которых не знаешь. В результате новички путаются, стартуют не с того, накапливают ошибочные или неправильные знания. На курсах информацию для вас структурируют и она всегда будет корректной.

Как облегчить обучение Data Science

Главная проблема для тех, кто решает учиться на Data-аналитика — незнание, с чем придется столкнуться и что с этим нужно делать. Чтобы определить, подходит ли вам Data Science, посмотрите на YouTube-ролики, авторы которых рассказывают, чем занимаются и какие навыки нужны, чтобы справляться с обязанностями. На первом этапе это поможет сложить представление о профессии. Не стесняйтесь писать авторам этих видео или расспрашивать своих знакомых, уже работающих в этой сфере.

Как бы вы не решили учиться, сами или на курсах, начиная обучение, обязательно почитайте, на какое направление идёте и какие знания вам нужны. Советую открыть вакансии на HeadHunter и прочитать требования. Составьте список навыков и по нему начинайте изучать специальность. В сети всё есть — документация, курсы по Data Science, статьи, видео.

Выбирайте литературу, с которой вам комфортно работать. Есть очень разнообразные варианты — и поверхностные, и углубленные. Легче будет тем, кто пришел из математических специальностей: у них было много статистики и теории вероятности. Есть бэкграунд, есть знания, которые нужны. Но если этих знаний нет — их не проблема быстро нагнать при желании.

Если вы заинтересованы в результате, найти время на учебу несложно. Посмотрите вебинар вместо фильма, решайте задачи, пока едете в метро. Устали — почитайте обзорные материалы. Если есть возможность, изучайте темы посложнее.

Самое трудное — не бросить. Это актуально и для курсов, и для самостоятельного обучения. Начинать учить что-то новое всегда сложно и важно соблюдать баланс. Занимаясь по 8 часов в сутки, вы перегрузите себя, испугаетесь обилия информации, быстро выгорите и бросите. Лучше обучаться планомерно: понемногу, но каждый день. Можете выделить два часа — занимайтесь два часа. Можете 15 минут — занимайтесь 15 минут. Главное — не забрасывайте и возвращайтесь к учёбе каждый день.

Ко мне на курс приходят учиться разные люди:

  • Самоучки, которые хотят структурировать знания, которыми обладают, получить базу и развиваться профессионально.
  • Те, кто пришли из IT, но хотят переквалифицироваться.
  • Те, кто пришли из совсем другой сферы, так как хотят сменить профессию.
  • Студенты технических и гуманитарных факультетов, которые хотят получить вторую специальность.

Я учу студентов строить модели на основе линейной регрессии, градиентного бустинга, дерева решений и делать на этой основе выводы. Все задачи взяты из реальных бизнес-кейсов. Например, в конце обучения ребята сдают итоговый проект. В формате соревнования нужно пройти все этапы работы с данными, построить модель и предсказать стоимость домов по датасету. Для этого задания есть лидерборд, в котором каждый студент может видеть, как он справился со своей задачей по сравнению с теми, кто проходил курс раньше. Бывает, что человек стесняется спрашивать. Если что-то непонятно, но кажется, что вопрос глупый, лучше его задать, чем упустить возможность и не усвоить материал.

Приходя на курсы, большинство студентов облегченно выдыхает. У них наконец начинает складываться представление о профессии, её методах и задачах. А практикуясь, они понимают, что работа им под силу. Есть и те, кто разочаровывается. В основном это те, кто приходит в Data Science с нуля из-за денег и не хочет вникать в детали. Когда таким людям приходится писать много кода, они разочаровываются. Но по-другому учиться не получится. Нужно трудиться, выполнять практические задания. Если готов работать, будет легко.

Я пришел в Data Science с физического факультета. Из базы у меня были знания статистики и теории вероятности, но я ничего не знал о программировании. Учился сам — смотрел курсы на Youtube, читал книги.

Без практики выучиться на профессию невозможно. Если решили обучаться своими силами, обязательно используйте тренажеры типа SoloLearn, чтобы набивать руку на кодинге. Научившись решать абстрактные задачи, вы сможете решать и реальные.

Некоторые скачивают простой датасет, строят несложную модель по шаблону и считают, что они полностью разобрались в теме. На самом деле этого мало и не хватит для работы — в Data Science можно разбираться всю жизнь и не получить даже половины знаний.

Чтобы было понятнее, вот пример задачи из моей работы. Нужно построить модель, которая измеряет эффективность сотрудника на основе данных: стажа, пола, возраста, того, как он проходит сертификации и тесты на знание продукта внутри организации. Отталкиваясь от этих данных моя команда построила модель, которая с высокой финансовой точностью предсказывала, выполнит ли сотрудник план к концу следующего месяца. Выявление таких людей позволяет на них влиять. Руководитель может прорабатывать с ними проблемы и добиться улучшения производительности. Такого рода задачи мы и решаем в Data-Science.

Зачем в Data Science программирование и Excel

Если вы уже знаете какой-то язык, будет легче. В Data Science используют Python, но у всех языков программирования есть общие паттерны. Из Python понадобится умения соединять таблицы, группировать, работать с аналитическими функциями. Также стоит изучить некоторые библиотеки. Для работы с массивами данных это NumPy, Pandas и Matplotlib для их визуализации. Ещё пригодятся TensorFlow и Keras — это готовые библиотеки с алгоритмами машинного обучения.

Частый вопрос — нужны ли для работы в Data Science глубокие познания в Excel. На самом деле, да. Хотя без Excel и можно обойтись, некоторые задачи в Python придётся делать гораздо дольше.

Например, если аналитик подготовит простой график в таблице, он потратит на это меньше времени, чем если будет писать его на Python. Единственная проблема Excel в том, что он начинает медленно считать, если в таблице больше полумиллиона строк. Пользоваться макросами в Excel сейчас не стоит: Python удобнее и быстрее.

Бывает, что процессы уже написаны на макросах, и тогда переводить их на Python — пустая трата времени. Многие компании не хотят этим заниматься, поэтому бывает, что специалистам приходится поддерживать эти технологии.

Резюмируя, Excel в Data Science знать нужно как минимум на уровне формул, графиков и сводной таблицы. Тем более, в вашей компании многие будут знакомы с Excel, но ничего не знать про Python.

Если вы аналитик, у вас много раз возникнет ситуация, когда нужно быстренько выгрузить данные в Excel и отдать коллегам, чтобы они их посмотрели.

Как устроиться на работу без «вышки»

Первое место найти тяжело. Вам может потребоваться полгода или даже год. Начинать её искать стоит сразу после учебы — обязательно такую, где будет обратная связь. В одних компаниях это код-ревью, в других — ментор. Он проверяет, какими методами джун решил задачу, правильно ли, подсказывает более лаконичное и красивое решение.

Пока ищите, есть смысл продолжать практиковаться. Это не сложно: сами для себя находите датасеты и решайте какие-то задачи. Например, можно оценить количество людей в городе возрастом от 45 до 70 лет. Затем сделать модель, которая определит долю этой возрастной группы среди покупателей хлеба или посмотреть, какие продукты они берут в магазинах чаще всего. Ставьте себе подобные задачи и решайте их всё время поисков.

Если вы хотите попасть на работу в определенную компанию, а вас туда не берут из-за отсутствия опыта, расстраиваться не стоит. Можно попробовать поработать полгода в другом месте, а затем, получив опыт, попытаться еще раз.

Открою секрет: устроиться джуном проще, чем попасть на стажировку в крупную компанию. Там настолько серьёзный отбор, что порой кандидаты по скиллам бывают выше джуниоров.

Главное на собеседовании — вести себя адекватно, не замыкаться, откликаться, если тебе пытаются помочь или подсказать. Идти на контакт, показывать свою обучаемость.

На профильное высшее образование в резюме смотрят только у новичков без опыта. Если на работу пришли устраиваться два таких кандидата, возьмут того, что с дипломом. Еще смотрят на профильные курсы, сертификаты, если уже сталкивались и есть доверие к какой-то школе.

Главное — опыт, если он есть, образование неважно. Будут задавать технические вопросы и смотреть на прошлые места работы. Можете рассказать о проектах: что делали, как решали задачи и какими методами. Этого для собеседования достаточно.

Из софтскиллов смотрят на умение общаться и работать в команде. Для Data Science это важно, чтобы правильно выстраивать рабочий процесс. Однажды я был сотрудником компании, где мы перекидывались одной фразой за весь день, в других же местах мы целый день о чем-то говорили. Важно не бояться спрашивать у коллег и наставников. Это единственный путь быстро прокачаться в профессии.

После неудачных собеседований я никогда не стеснялся задавать вопросы о том, чего мне не хватило. На всякий случай возьмите у технического специалиста, который с вами говорил, контакты, чтобы задать этот вопрос, если вам откажут. HR оставит стандартный ответ и вы не узнаете, что именно было не так. Например, устраиваясь на работу, я видел, что везде нужен SQL. Когда не справился с собеседованием, попросил поделиться материалами. В итоге мне посоветовали сайт SQL-ex и я там его осваивал.

В практике моего друга была ситуация, когда он хотел переквалифицироваться в Java-разработчика, пошел на собеседование и завалил его. Он спросил, где не дотянул; ему посоветовали книгу. Сказали, если изучишь — приходи через полгода и попробуй снова. В итоге его действительно взяли на работу в ту же компанию.

Если хотите получить большое конкурентное преимущество, есть смысл поизучать статистику и теории вероятности, чем глубже, тем лучше. Можно даже взять пару уроков у репетитора.

Не расстраивайтесь, если собеседование не удалось. Любая оценка очень субъективна. Даже если в одном месте сказали, что профессия «не ваше», в другом ваш опыт может быть ценен. Чем больше собеседований вы пройдете, тем легче они будут даваться. С какого-то момента страх уйдет совсем. Встречи с работодателями — это полезно. Они локализуют те знания и скиллы, которых вам не хватает и позволяют не останавливаться.

  • data scientist
  • data analyst
  • machine learning
  • computer vision
  • nlp
  • Блог компании GeekBrains
  • Big Data
  • Машинное обучение
  • Карьера в IT-индустрии
  • Data Engineering

Краткий гайд — резюме для Data Scientist

Резюме/ CV — инструменты, с создания или обновления которых, чаще всего начинается поиск работы. Обновление резюме чаще всего необходимо, когда Вы просто ищете работу, и тем более требуется, если ищете работу Remote, с переездом в другую страну, когда меняете сферу или хотели бы повысить свой уровень дохода.

Фактически часто структурированность, содержание и качество оформления Вашего резюме/ Вашего CV влияет на Job Offer или предложение о зарплате и условиях, поэтому этот документ необходимо подготовить прежде, чем связаться с будущими работодателями.

И, хотя каждый обладает хотябы базовой необходимой экспертизой по составлению резюме, хотя существует множество бесплатных шаблонов и сервисов для подготовки резюме, есть все же ряд правил, которые могут помочь решить вопрос с дизайном и версткой, всё же есть правила HR-кухни, которые лучше соблюдать, чтобы получить наибольшее количество ответов от работодателей

Структура резюме

Резюме — это в первую очередь, документ, так как он предоставляется работодателю, и может быть использован для принятия решения о Job Offer, необходимо указать информацию, которая может быть важна для определения уровеня зп и позиции, Вашего соответствия должности. Хорошее резюме для программиста должно содержать следующую информацию:

1. Персональная информация

Персональная информация включает Ваше полное имя (ФИ), номер телефона и адрес электронной почты.

  • Если у вас есть профиль в LinkedIn или GitHub, убедитесь, что он тоже указан, убедитесь в качестве кода, предсатвленного на GitHub.

В идеале делать резюме в шаблоне, где ссылки будут кликабельными.

Например, с небольшой корректировкой, можно использовать для этого шаблоны в Latex, которые можно редактировать в OverLeaf. Такие шаблоны часто используют дата саентисты при откликах в Google, Amazon etc

  • Ccылка на бесплатный LateX шаблон для резюме AutoCV:
  • Ccылка на бесплатный LateX шаблон для резюме Awesome CV:
  • Если есть научные статьи, публикации, укажите ссылку на Google Scholar (если статьи есть, а Google Scholar нет, желательно такой аккаунт создать)

-Если Вы развиваетесь в сфере Data Science — будут полезны дополнительные публикации на таких конференциях как CVPR, ECCV, ICML etc. Информацию о таких публикациях полезно указать как в Google Scholar,

Если вы дизайнер, UI/UX дизайнер, Product Manager — может быть полезно сделать портфолио своих работ на:

  • Behance – сервис для создания портфолио для дизайнеров и творческих специалистов, предоставляющий множество возможностей для демонстрации ваших работ.
  • Dribbble – платформа для дизайнеров и творческих специалистов, на которой можно выложить свои работы и получить отзывы и комментарии от других профессионалов.
  • Coroflot – ресурс для дизайнеров и творческих специалистов, где можно создавать профиль и демонстрировать свои работы.
  • Полезные сервисы для размещения портфолио для разработчиков игр:
  • Steam — онлайн-сервис цифрового распространения компьютерных игр и программ, разработанный и поддерживаемый компанией Valve
  • Desura — Платформа цифровой дистрибуции для платформ Windows, Linux и macOS, позволяющая пользователям загружать и устанавливать игры и модификации к ним

Все ссылки в идеале сделать кликабельными, чтобы представитель работодателя мог легко посмотреть все доступные примеры Ваших работ по ссылкам.

2. Заголовок, соответствующий сфере

Важно, чтобы заголовок соответствовал профессиональной сфере, например, Product Manager, UI/UX designer, Senior Data Scientist, Senior C++ developer

Заголовок может отличаться от Вашей должности на последнем месте работы, хотя и желательно, чтобы они совпадали, но крайне желательно, чтобы он соответствовал вакансии, которую Вы ищете.

Иногда Ваш опыт может соответствовать 2 сферам, тогда лучше сделать отдельные резюме, с разными заголовками под разные вакансии — это сделает резюме более релевантным.

3. Summary

По Summary мной уже написана подробная статья на habr: https://habr.com/ru/post/700290/ 3900 читателей.

Summary — это первый блок резюме, который видит работодатель, когда начинает читать резюме, на основании Summary HR или другой представитель работодателя может принять решение, читать ли резюме дальше ( особенно если оно состоит из 2 страниц), и пригласить ли Вас на встречу.

Summary — это краткое введение, помещаемое в верхней части резюме. Оно описывает краткую, обобщенную информацию о Вас, Вашем опыте работы, описывает профессиональные достижения и навыки.

Это верно, что на резюме будут откликаться и без Summary, но Summary помогает решить целый ряд задач и при текущей ситуации на рынке труда в ИТ-сфере, при поиске работы Remote и c целью Relocation, Summary может играть решающую роль, как при начале коммуникации, так и при обсуждении Job Offer, если его верно структурировать.

Подробные детали которые важны для Summary и пример хорошего Summary, можно прочитать здесь: https://habr.com/ru/post/700290/

4. Опыт работы

Описание опыта работы принято писать в обратном хронологическом порядке — начиная с последнего. В резюме следует указать название компаний, их описание, должности, которые вы занимали, и года занятости.

Укажите примеры проектов, которые вы разработали или в которых участвовали и свои достижения на каждой должности.

Как лучше всего сформулировать опыт работы в резюме?

  • Название компании, даты начала — окончания работы в компании
  • Описание сферы и содержания деятельности компании, масштабов компании (обязательный блок, особенно, если рассматриваете вакансии с переездом, работу remote)
  • Должность — можно указать не только, как записано у Вас в должностной инструкции, но и корректируя формулировки должности, в соответствии с вакансиями, которые интересны ( в соответствии с реальностью). Часто бывает что Вы работаете как UX дизайнер, но по факту выполяете и функции Product Manager. Или работаете DS, но выполняете функции Lab Leader, CTO etc. Например, один из моих клиентов сейчас — работает Senior Data Scientist/ DS Team Leader, но так как стартап небольшой, он иногда выполняет и задачи СТО, что позволяет указать в резюме, если оно потребуется, как реальную должность, так и роль, которую приходилось выполнять.Такие формулировки помогают работодателю соориентироваться в том, какие задачи Вы выполняли и в каких задачах, ролях на Вас можно рассчитывать.
  • Обязанности Желательно чтобы обязанности были похожи на формулировки обязанностей в вакансиях, которые рассматриваете. Поэтому, прежде чем писать текст резюме, желательно посмотреть 3-5 интересных вам вакансий на открытых ресурсах
  • Проекты. Один из важнейших блоков в резюме. Иногда опыт в резюме вообще описывается как проекты + результаты в цифрах.

Формат указания проектов в резюме:

Содержание проекта важно указывать так, чтобы описание было ясным как гумманитарию, так и техническому специалисту.

Например, если вы делали конкретное решение для голосового ассистента, полезно сначало указать, что речь о колосовом ассистенте.

При описании проекта важно использовать ключевые слова, соответствующие Вашей ключевой экспертизе ( например ML, DL, NLP еtc)

В этой части часто оценивается, что на самом деле сделали именно Вы, здесь верен общий принцип, что предпочтительны hard skills, которые были использованы, поэтому полезно в момент описания проектов изучить 3-5 вакансий, на которые будете направлять отклики, посмотреть, что работодатель ищет, и указать именно такие проекты, и соответствующие требованиям Ваши действия, которые привели к результату.

В случае если переходите в новую сферу, где проектов пока нет, что можно сделать:

  • PetProject — ваш самостоятельный проект ( подходит для всех профессиональных сфер)
  • 10+ идей для Pet Project https://medium.com/@pocteg/10-идей-для-pet-projectа-b262a851b91c
  • OpenSource Project ( подходит для разработчиков, DS специалистов)
  • Hackhaton ( разработчики, DS, Backend, Frontend developers, Designers, Product Managers)
  • The volunteer project ( Вы можете найти социальный проект, которому требуется ваша помощь, для такоего проекта вы можете выполнить некоторые задачи, связанные с Tech как волонтёр. Например, это может быть проект, связанный с медициной, помощью детям-сиротам и так далее, зависит от того, какие волонтерские вакансии найдете)
  • Дополнительные проекты для опыта работы в Data Science, можно найти на таких платформах как Kaggle ( Kaggle — платформа с соревнованиями по Data Science, на платформе есть задачи разного уровня сложности и из различных сфер, таких как ML, NLP, Computer Vision и тд. Кроме того, там есть открытые дата сеты, в том числе собранные такими компаниями как facebook, google, чего нет на других платформах). Примеры полезных для Tech skills задач (примеры своего кода можно разместить на github), которые можно найти на платформе Kaggle:

● Mechanism of Medicine action, NLP:

● Lyft, Motion prediction, Computer Vision:

● Google, football, Computer Vision, Reinforcement Learning:

  • Результаты, которых удалось достичь в указанных проектах.

Результаты важно указывать в цифрах. Среди результатов можно указать:

  • Как результаты Вашей работы повлияли на результаты работы компании ( увеличение прибыли, заработанные деньги, экономия — такие данные бывают под NDA, но при этом, часто в PR статьях они уже описаны, такие данные можно использовать для своего резюме).
  • Как Ваши результаты повлияли на увеличение прибыли компании, увеличение каоличества заработанных денег
  • Экономия денег компании, за счет достигнутых Вами результатов с которыми связаны результаты Вашей работы, предложенные и реализлованные Вами решения

Такие данные можно указать не всегда, но хорошо, когда всё же выходит это сделать)

Так же можно указать:

  • Ускорение алгоритмов работы системы
  • Уменьшение затрат памяти и тд.

Общий принцип — результаты указываются в цифрах, в идеале — полезно, когда эти цифры выражаются в финансовых показателях. Но если это не так, можно указать, что удалось что-то улучшить в несколько раз, на определенное количество процентов и тд.

Когда совсем нет подходящих показателей, в которых можно указать результаты — можно написать о масштабах проекта над которым работали ( количество пользователей), чтобы показать, насколько над большим проектом приходилось трудиться.

На самый крайний случай — можно указать количество строк кода, найденных багов и тд.

Это опишет обьем работы, при этом этот показатель все же менее значителен, чем финансовые показатели, на которые удалось повлиять.

Для молодых специалистов, специалистов с сменой сферы — показателем будет успешность проекта, аудитория, количество скачиваний и тд, или сам факт завершенности и качество проекта, качество кода, который можно будет посмотреть на github.

В каждом опыте работы после обязанностей( полезно указать 3-4 обязанности), проектов ( можно указать 3-4 проекта), результатов ( 3-4 результата в цифрах), полезно указать технологии, которые Вы на данном месте работы использовали.

Технологии обычно указывают следующим образом:

От сложного к более простому, от общего к частномы. Сначала указывают языки программирования, затем если Вы работаете в ML, укажите, например: Machine Learning, Deep Learning, AutoML, RL, NLP, Berts, Transformers, Compuer Vision, GANs, CCN etc.

Далее библиотеки и фреймворки. Об этом подробнее — ниже в блоке “технические навыки”

*Почему здесь предлагается именно такая структура опыта? Можно ли как-то иначе?

Да, можно, но такая структура наилучшим образом показывает детали Вашего опыта

Часто используют другую форму: резюме, ориентированное на результаты.

В ней в каждом блоке опыта будут показаны только результаты в цифрах.

  • Такая структура позволяет существенно сократить резюме ( при этом, это далеко не всегда нужно, резюме вполне можно описать на 2 страницах, используя структуру, описанную в этом гайде)
  • Подходит для вакансий в компаниях, где ключевая компетенция — ориентация на результат. Amazon, например.

5. Образование

В резюме часто образование указывают в начале, это не совсем верно. Такое расположение элементов может быть верно только если опыт работы пока небольшой и кандидат ищет 1ую работу. В таких случаях, если оконченный вуз является хорошим государственным вузом, может быть важно какой именно ВУЗ окончил кандидат.

Образование принято указывать начиная с послденей степени PHD, Ms, Bd.

Указывают следующие данные:

  • Год окончания университета
  • Университет
  • Специализацию ( в случае если диплом релевантен позиции, иногда указывают тему диплома или диссертации, например это уместно если проект связан с Data Science, Auto ML, RL etc.)
  • Степень ( PHD, Masters, Bachelor Degree).
  • Средний балл ( средний балл имеет смысл указать, в случае если он выше чем 4.8 или соответствующий эквивалент в других системах оценки успеваемости. В случае если получен красный диплом, полезно указать, with honors)

Школу указывают только в случае если Вы окончили специализированный лицей, школу где начинали свой опыт в ИТ, программировании, анализе данных и тд.

Например, полезно указать, если вы учились в 57 школе, СУНЦ и других школах, с углубленным изучением математики, физики, школой олимпиадного программирования и тд.

6. Достижения и публикации

  • Если у Вас есть научные публикации на таких конференциях как ECCV/ICCV, ICML, CVPR etc, обязательно укажите, даже если они есть на Google Scholar — не все читатели резюме последуют по ссылке, даже если Вы сделали их кликабельными. Так же не все знают что это высокий уровень конференции. Для такого круга читателей Важно пояснить не только о какой конференции речь, но и о ее месте в кругу других конференций в данной сфере.
  • Если есть опыт создания других публикаций их тоже можно указать 2-3, но они могут нести эффект меньше. Не стоит загружать резюме сильно но указать несколько публикаций, если они есть — полезно.
  • Укажите информацио о Ваших победах на олимпиадах по программированию, если даже есть опыт участия в ACM/ ICPC — это будет конкурентным преимуществом. Если побеждали в всероссийской олимпиаде, даже если участвовали в городском этапе и заняли призовые места — укажите. Для резюме важен позитивный Track-Record.
  • Укажите сертификаты и лицензии, которые у вас есть.
  • Укажите тренинги или курсы, которые вы прошли. Здесь важно понимать что в Европе, США на курсы, указанные в резюме, обращают немного внимания. Важнее практический опыт, но 2-3 курса можно указать, если они были профильными, имеют хорошую репутацию и соответствуют описанию вакансии.

7. Ключевые навыки

Блок Tech Skills в данной структуре предлагается указать — в конце резюме.

Блок технологии в каждом опыте работы, который описывался ранее и блок Tech Skills немного дополняют друг друга и при этом, отличаются.

Блок Tech Skills — это технические навыки, общие для всего опыта работы, а блок Технологии в каждом опыте работы — про технологии, которые применялись конкретно в этом месте.

Зачем это нужно? Если в Вашем опыте указаны разные противоречивые или дополняющие друг друга технологии, полезно понимать что, где, на каком уровне сложности приходилось делать.

Особенно для работодателя будут важны скиллы, приоритетные для данной позиции.

В данном блоке укажите ключевые технические навыки в порядке убывания сложности.

Для Data Science:

Укажите языки программирования, направления в ML ( Machine Learning, Deep Learning, AutoML, RL, NLP, Berts, Transformers, Compuer Vision, GANs, CCN etc.),

Бибилиотеки и фреймворки: Pytorch, Caffe2, Tensorflow etc.

Также можно указать: среды разработки, фреймворки и операционные системы, которые вы знаете.

Этот блок полезно сделать завершающим, так как при анализе резюме, рекрутер или тот, кто будет резюме читать, в связи с рядом законов внимания, сфокусируется на начале: summary, где следует указать Ваш основной опыт ( этот блок лучше сделать, идентичным описанием требований к вакансиям в Google, которые можно в большом обьеме можно найти на сайте Google.Careers), а так же в Tech Skills ( этот блок отвечает на вопрос: что Вы, действительно, знаете и умеете?).

В связи с этим, данные блоки важно сделать наиболее информативными, так как они делают наибольший вклад в принятие решения о том, стоит ли пригласить Вас на интервью и если да, то какой уровень Job Offer, следует предложить Вам в случае успеха.

Если Вы читаете сейчас данный гайд по резюме, возможно, Вам будет полезно сделать резюме в современном шаблоне.

В связи с этим, я бы хотела порекомендовать несколько сервисов с бесплатными и доступными шаблонами.

Универсальный принцип для таких шаблонов — сначала подготовьте текст резюме, пусть это будет текст в Word или Notion — где Вам легче редактировать, и после — обращайтесь к готовому дизайну — иначе заниматься редакцией summary, резюме одновременно — может быть не очень просто.

В заключение, направляю

Бесплатные сервисы с шаблонами для Ваших резюме

Список полезных сервисов с бесплатными шаблонами для Ваших резюме:

  • Canva — https://www.canva.com/templates/resumes/
  • Zety — https://zety.com/resume-templates
  • Novoresume — https://novoresume.com/resume-templates
  • VisualCV — https://www.visualcv.com/resume-templates/
  • MyPerfectResume — https://www.myperfectresume.com/free-resume-templates
  • Resume-Now — https://www.resume-now.com/templates
  • Resume.com — https://www.resume.com/resume-templates/
  • Hloom — https://www.hloom.com/resume-templates/
  • Resumonk — https://www.resumonk.com/resume-template

Доработка, обновление резюме.

Что касается доработки текста резюме, таргетированию текста на интересующие Вас вакансии, можно сделать это самостоятельно — сравнивая свой текст с описаниями вакансий, например Google, Amazon или — обратиться за решением этой задачи к профессиональному и опытному консультанту, имеющему опыт найма в подобные компании изнутри, имеющему широкий круг связей в компаниях в Европе, Азии, США, использующему реальный опыт работы при составлении рекоммендации.

В целом, написание CV – это формализованный процесс, который является первым шагом в поиске работы, но возможно он существенно повлияет на Ваш Job Offer. Поэтому сохраняя честность, по поводу своей реальной работы и результатов, не следует быть скромными. Важно указывать реальный опыт в ИТ, количество лет опыта, включая победы в олимпиадах и опыт, который был в юности. Будьте честны и достаточно смелы. чтобы проявить себя с лучшей стороны.

  • резюме
  • резюме it-специалиста
  • карьера
  • data science
  • product management
  • Управление персоналом
  • Карьера в IT-индустрии

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *