Я только что сбежала от восьми лет учебы и упорной работы не имея никакого плана. Возможно вам интересно, почему люди идут на такие поступки. Дело в том, что на протяжении долгого времени мой босс отбивал мое желание работать, и я понимала, что пора что-то менять.
Мой молодой человек предложил мне стать data scientist. Моей реакцией, конечно, было «Ты сошел с ума!», ведь я совсем ничего не знала о программировании. Без сомнений он переоценивал мои способности. Вот и синдром самозванца снова напоминает о себе.
Примерно через две недели моя подруга Анна предложила то же самое. Немного поразмыслив, я всерьез начала обдумывать эту идею. А почему бы и нет? Так я решила вновь стать новичком и начать новую жизнь в роли data scientist.
Я хотела учиться в своем темпе, поэтому решила пройти онлайн курсы. Я полагала, что с докторской степенью в нейробиологии я уже получила достаточно формального обучения для работы в data science. Мне просто нужны были практические знания.
Я расскажу о четырех разных курсах, которые я прошла, и о том, как они привели меня к работе с data science в стартапе по здравоохранению в Силиконовой долине.
В то время большинство найденных мной онлайн курсов были бесплатными. Поэтому я бросила себе вызов – получить все необходимые навыки не потратив ни копейки. Что тут скажешь, я – настоящая скряга.
Базовые навыки
Когда я только оставила свою докторскую степень в Калифорнийском университете в Сан-Франциско, у меня абсолютно не было опыта в программировании. В своих исследованиях я использовала статистические показатели, но в малых масштабах. Все анализируемые массивы данных были созданы мной же в лаборатории. По этой причине количество наблюдений было крайне мало. Мне нужно было научиться писать код и анализировать данные в гораздо большем объеме.
Приступая к написанию кода
Когда я приняла решение о том, что хочу стать data scientist, прежде всего мне хотелось научиться писать компьютерные программы. Поскольку раньше я никогда не кодила, весь процесс был для меня полной неизвестностью. Я решила, что если возненавижу писать код, то data science точно не для меня. Казалось, что для начала идея была хорошей.
Мне повезло, поскольку мой партнер Бен работал во многих отраслях технологий и смог указать мне правильное направление. Он предположил, что Python подойдет мне лучше всего. Python идеально подходит для анализа данных, он универсален и отлично справляется с большими массивами данных. Начало было положено.
Изучение программирования
1. Codecademy
В начале обучения я использовала Codecademy. Я начала с курса «Introduction to Python», но не уверена, что он все еще существует, поскольку прошла его еще в 2014 году. Если бы мне сейчас нужно было начать изучать Python, я бы наверное начала с курса «Analyze Data with Python».
Мне кажется, что Codecademy – это отличная отправная точка. Главным преимуществом для меня было то, что я могла писать код прям в браузере. У меня все также хуже всего получается правильно устанавливать средства программирования на компьютер. Поэтому в начале было приятно этого избежать. Было спокойно от мысли, что если мой код не будет работать, то это из-за ошибки в синтаксисе, а не ошибки в установке средств программирования.
Мне также нравилось как занятиям можно было уделять по несколько минут. Я заходила на Codecademy, когда у меня было свободное время, и решала несколько проблем, ожидающие моего внимания. Этот поэтапный прогресс означал, что я не пугалась объемов и не застревала в них.
К тому времени как я закончила курс, на сайте предлагались только несколько курсов, и этот был бесплатным. Я была поражена качеством бесплатных онлайн программ.
Как только я изучила основы Python, мне нужно было начинать повышать свои знания по статистике и учиться анализировать данные в большем масштабе.
Изучение анализа данных
2. Coursera Data Science Specialisation от Джонса Хопкинса
Вторым курсом я прошла «Coursera Data Science Specialisation» от Джонса Хопкинса. В то время можно было бесплатно получить почетный сертификат, а платить нужно было только за верифицированный сертификат.
Верифицированный сертификат мне был не так важен. Мне же нужно было продемонстрировать навыки с курсов во время технических собеседований. Поэтому я выбрала бесплатную версию.
Эта серия курсов преподавалась на языке R, что для меня стало недостатком. R – отличный язык программирования для статистического анализа и пользуется популярностью в научных кругах. Однако, для data science я хотела выучить Python. Мне казалось, что он будет более полезен для стартапов, где я хотела работать.
Я заглянула в несколько курсов по анализу данных на Python, но они предполагали навыки, которых у меня еще не было. Мне кажется, что большинство этих курсов были направлены на разработчиков программного обеспечения, которые хотели перейти в data science. Поэтому создатели курса предположили, что у вас уже есть существенные навыки программирования и вы уже знаете как настроить свою среду на Python.
Мне нравилось, что этот курс объяснял все аспекты с самого начала. В первом занятии были пошаговые инструкции о том, как установить R и R-Studio. Было легче проходить последующие курсы, зная, что технические проблемы уже не возникнут.
Также этот курс вел департамент здравоохранения, что мне очень подходило. Мой опыт в области медицинских наук позволял мне с легкостью понимать приведенные примеры. Они приводили примеры влияния качества воздуха на астму и другие массивы данных из здравоохранения. Поэтому я могла сосредоточиться на содержании курса, а не пытаться понять сценарии, приведенные для анализа данных.
Эта серия курсов действительно помогла мне освоиться на базовом уровне понимания основных аспектов data science. Она затронула программирование на языке R, очистку данных, анализ, регрессию и машинное обучение. Мне правда нравилось учиться кодить и использовать код для анализа данных, так что я была вдохновлена на продолжение обучения.
Информационные интервью
На этом этапе своей переквалификации я начала просить своих знакомых представить меня людям в Сан-Франциско, которые также перешли из научных кругов в data science. Некоторые смогли мне помочь, так что я назначила как можно больше информационных собеседований.
Мой друг представил меня data scientist из компании Modcloth с похожим карьерным путём. Она также была нейробиологом, чей совет мне очень пригодился.
Её главной рекомендацией было выучить SQL.
Изучение запросов к базам данных
3. DB5 SQL Stanford Online
В курсе Джонса Хопкинса на Coursera не было ни слова про SQL. Моя новая знакомая говорила, что большая часть её повседневной работы заключалась в поиске по базе данных. Ей нужно было извлекать информацию для команд по управлению бизнесом и маркетингу. На статистический анализ и машинное обучение уходило совсем немного времени.
Я последовала её совету и начала самостоятельный курс «SQL course Stanford Online». Из всех пройденных курсов этот – мой любимчик, потому что преподавательница оказалась просто отличной и использовала простые примеры для объяснения понятий. Также для объяснения одного понятия она использовала несколько способов.
С тех пор я рекомендовала этот курс очень многим, потому что считаю, что хорошая основа в SQL необходима каждому data scientist. Многие курсы по data science, на которые я натыкалась, не рассказывали как получить данные из базы данных при помощи SQL. По-моему, это большая ошибка. В большинстве курсов можно найти готовый CSV-файл для студентов, однако я редко встречала такое непосредственно в работе.
Как только я закончила курс по SQL на платформе Stanford Online, я начала подавать резюме на вакансии в data science. Тогда я жила в Австралии и начала проходить собеседования по скайпу в стартапы области залива в Сан-Франциско. Во время собеседований мне хотелось продолжать развивать свои навыки.
Закрепление понятий
4. edX Foundations of data analysis
Затем я прошла курс «Foundations of data analysis» на платформе edX, используя R. Он помог мне вспомнить те понятия, которые я уже проходила на курсе от Coursera.
Я твердо верю, что различные методики преподавания помогают усвоить новую информацию. Гораздо проще разбираться в статистике и концепциях машинного обучения, изучая их по второму кругу. Я думаю, что этот курс дал мне более глубокое понимание тем.
Я все еще заканчивала курс, когда успешно прошла собеседование в Amino – стартап по здравоохранению в Сан-Франциско, получила рабочую визу и переехала в США.
Получение работы в data science
Мне кажется, что заключительное собеседование было успешным, потому что я обладала не только приличными навыками написания кода и смыслила в статистике, но, что гораздо важнее, имела знания в области здравоохранения, экспериментального дизайна и научного метода.
На мой взгляд, именно эти дополнительные компетенции сделали мое резюме более значимым в глазах работодателей, и они рискнули взять меня в стартап. Я была новичком, которому требовалось в разы больше обучения. Мне кажется, что всех пройденных курсов хватило ровно на то, чтобы приемная комиссия обратила на меня внимание, но мой опыт в сфере здравоохранения действительно выделял меня среди других кандидатов.
Поэтому, если вы хотите сменить профессию и перейти в data science, я бы рекомендовала искать те компании, где ваши существующие знания будут цениться.
Что бы мне хотелось изучить
Главным пробелом в моих знаниях, который я бы хотела заполнить до начала работы в новой компании, оказалось использование Git через командную строку. Раньше я никогда не использовала терминал или командную строку, поэтому понятия не имела как использовать Git для операции фиксации моего кода в репозитории Github своей компании.
Нескольким специалистам потребовалось немало времени, чтобы ввести меня в курс дела. Хотелось бы мне хотя бы иметь представление об этой теме, чтобы не терять их драгоценное время. Мои коллеги абсолютно потрясающие и будто бы совсем не были против помочь мне, но в первые дни я чувствовала себя обузой.
В конце концов я втянулась, мне также очень помог курс «Learn Code the Hard Way Command Line».
Если вы раздумываете об аналогичном переходе в data science – дерзайте! Для меня этот выбор оказался верным. Все учатся по-разному, но если вы обладаете самодисциплиной и заканчиваете то, что начинаете, у вас есть все шансы выучить data science при помощи онлайн курсов. Я желаю вам удачи и с радостью отвечу на любые вопросы.
Узнайте подробности, как получить востребованную профессию с нуля или Level Up по навыкам и зарплате, пройдя онлайн-курсы SkillFactory:
- Курс «Профессия Data Scientist» (24 месяца)
- Курс «Профессия Data Analyst» (18 месяцев)
- Курс «Python для веб-разработки» (9 месяцев)