Ученый по обработке и анализу данных Сахар Насири сначала учился в колледже, чтобы изучать промышленную инженерию. Однако, пройдя курс машинного обучения Эндрю Нг по рекомендации профессора, она знала, что хочет, чтобы ее будущее было связано с ИИ. Теперь она использует искусственный интеллект, чтобы помочь Delta Airlines поддерживать свои самолеты в отличном рабочем состоянии. Она рассказала нам о своих первых трудностях на собеседовании, о том, как она получила свою первую работу, и о том, как важно правильно понимать статистику.

Можете ли вы рассказать мне о вашей нынешней роли? Когда вы начали, какова ваша должность и каковы ваши основные обязанности?

Недавно я перешел в новый отдел Delta под названием Engineering Analytics, где я использую NLP для анализа текстовых журналов, созданных обслуживающим персоналом, бортпроводниками и пилотами. Например, стюардесса может написать комментарий на странице журнала о том, что она чувствует неприятный запах. Основываясь на том, как она это описала, наша программа может пометить ее комментарий как серьезную проблему или несерьезную проблему. Это оптимизирует график технического обслуживания и экономит Delta много денег. Раньше специалисты по надежности выполняли эту работу вручную, и это занимало очень много времени.

Как выглядит ваш обычный день?

Я провожу много времени за чтением статей о преобразователях и моделировании последовательностей, и все они относятся к конкретной проблеме, над которой я работаю.

Другая часть моей работы — руководство завершающим проектом в университете, с которым мы сотрудничаем. Я стараюсь запачкать руки и как можно тщательнее просматривать их код, чтобы помочь им стать лучше. Студенты получают реальный жизненный опыт и помогают нам исследовать новые решения для наших проектов. Они делятся множеством хороших идей. Возможно, в следующем семестре я возглавлю еще один проект с другим университетом.

Как вы заинтересовались машинным обучением и наукой о данных?

Изначально я пошел в школу, чтобы заниматься промышленным проектированием. Однако в моем университете была одна из лучших команд по робототехнике в Иране. Я хотел присоединиться, поэтому в свое первое лето в бакалавриате я прошел курс робототехники. Во время одного занятия наш профессор показал нам презентацию курса Эндрю Нг по машинному обучению из Стэнфорда. В конце концов я прошел курс и подумал: «Вау, это то, чем я хочу заниматься в будущем».

Что самое важное вы узнали о науке о данных как профессии с момента выхода на рынок труда?

Раньше я недооценивал силу статистики и потерял много возможностей трудоустройства из-за отсутствия статистических знаний. Это заставило меня понять, что мне нужно наверстать упущенное.

Когда вы поняли, что вам не хватает знаний в статистике и математике?

Я точно помню момент. Я проходил собеседование с Paypal, и на последних этапах меня спросили, какой график я бы использовал для анализа взаимосвязи между двумя непрерывными переменными. Ответом был точечный график, чтобы он показывал определенные закономерности, но в то время я этого не знал. Это были очень простые вещи, но у меня еще не было статистического опыта в исследовательском анализе данных. В аспирантуре нас учили, как проводить исследовательский анализ данных для построения различных типов графиков, но не делали акцента на понимании того, когда нужно знать, какой тип графика использовать.

Как только вы определили эти недостатки, как вы их наверстали?

Я начал с двух курсов по статистике на Coursera: один в Университете Дьюка, а другой в Калифорнийском университете в Санта-Круз. Оба были действительно ценными. Например, теоретически я всегда знал, что такое p-значение, но курсы помогли мне по-настоящему понять, как оно работает на самом деле.

Примерно в то же время подруга из колледжа переехала из Ирана в Канаду, так что мы с ней оказались в одном часовом поясе. Мы договорились начать вместе изучать разные алгоритмы. Каждую неделю мы выбирали новый алгоритм и узнавали о нем все подробности, используя документы, веб-сайты по науке о данных и видео из DataCamp, Kahn Academy и канала YouTube под названием StatQuest.

Расскажите мне больше о вашей учебной группе. Как вы назначали время встреч и координировали задачи?

Сначала мы договорились изучать один и тот же алгоритм самостоятельно в течение недели, а затем созваниваться по воскресеньям, чтобы рассказать о том, что мы нашли. Вскоре мы решили, что было бы лучше, если бы мы действительно учились в одно и то же время. Мы пытались найти час каждый день и быть онлайн вместе. В это время мы говорили о бумаге, делая заметки. Закончив изучение каждого алгоритма, мы просматривали все свои записи и создавали документ, на который можно ссылаться при подготовке к собеседованию. Мы временно остановились, потому что она заканчивает магистратуру, а я занят своей новой должностью, но мы планируем возобновить работу, потому что мы оба многому научились.

Исходя из вашего опыта, на какие алгоритмы вы бы порекомендовали людям обратить внимание?

Я не думаю, что компании ожидают, что вы будете знать каждую деталь каждого алгоритма, но они хотят, чтобы вы знали алгоритмы, которые вы указываете в своем резюме. Вы также должны знать некоторые из основных, такие как логистическая регрессия, деревья решений и градиентный спуск.

В интервью вы хотите иметь возможность отвечать на вопросы, которые просят вас выбрать один алгоритм вместо другого для определенного типа анализа, и объяснять, почему. Например, один из самых популярных вопросов по моему опыту: почему вы используете дерево решений, а не метод опорных векторов для задачи классификации? В своем последнем интервью я представил проект, в котором сравнивались несколько различных алгоритмов классификации, а также их время выполнения и точность. Я смог объяснить, почему я выбрал тот, который сделал, и какие гиперпараметры я настроил, чтобы получить наилучший результат.

Как вы, наконец, нашли свою первую работу?

Моя первая работа тоже была в Delta, но в другой роли в науке о данных. Для этой роли их не очень интересовало, знаю ли я математику, стоящую за всем. На самом деле их заботило только то, умею ли я программировать на Python, а у меня всегда хорошо получалось с Python и SQL.

Первое, что я сделал после того, как меня взяли на работу, — изучил все, что мне не удалось во время других собеседований. Я начал с деревьев решений, затем кластеризации K-средних и всех остальных основных алгоритмов машинного обучения.

Какие вопросы вам задавали во время интервью?

Они дали мне несбалансированную классификационную задачу и попросили объяснить, как я буду ее анализировать. Этот же вопрос возник во время предыдущего собеседования, за исключением кредитных карт. Я плохо справился с предыдущим интервью, потому что не смог объяснить, почему моя точность была низкой. С Дельтой я смог уверенно объяснить весь свой анализ благодаря проведенному мною изучению.

Как выглядела ваша повседневная работа на той первой работе по науке о данных?

Моя роль заключалась в том, чтобы быть специалистом по данным, работающим над оптимизацией цен. Каждый рейс Delta имеет множество возможных цен для каждого пункта отправления и назначения, поэтому очень сложно найти ту, которую лучше всего рекламировать. В то время, когда меня наняли, они нанимали специалистов по данным и программистов на Python, чтобы перевести весь процесс на машинное обучение для лучшей оптимизации.

Я также работал над сезонностью. В низкий сезон билеты дешевле, а в высокий – дороже. Раньше сезон для каждого пункта отправления-назначения определялся аналитиками вручную, что требует много работы и очень неэффективно. Мы разработали процесс, который проходит через все пункты отправления и назначения и находит для них сезоны и оптимальные цены менее чем за два часа.

Есть ли у вас какие-либо советы для людей, стремящихся стать учеными данных?

Я всегда говорю людям никогда не прекращать изучать статистику. Если вы хотите быть специалистом по данным, вам всегда нужно знать статистику.

Я думаю, что любой может научиться использовать пакеты машинного обучения в Python или R. Что отличает специалиста по данным от других, так это его способность объяснять модели, которые они выбирают, и то, как настраивать гиперпараметры. Я думаю, что изучение математики, лежащей в основе алгоритмов, и логики, которой они следуют, необходимо для нашего процветания.

Многим людям жизнь кажется слишком занятой, чтобы планировать ежедневное или даже еженедельное время для учебы. У вас есть совет, как вписать обучение в свой день?

В детстве мой отец был одержим тайм-менеджментом. Когда мне было 12, он повел меня на семинар по составлению расписания. Оратор сказал то, чего я всегда старался придерживаться: не планируйте что-то, если вы не собираетесь этого придерживаться; Вы только истощите себя и потеряете мотивацию делать что-либо еще. Если я пытаюсь заставить себя учиться, но никак не могу найти время, я признаю, что морально не готов сделать это прямо сейчас. Я просто делаю перерыв. Как только пройдет какое-то время, я попытаюсь забрать его снова.

Например, во время одного из моих поисков работы у меня возникли проблемы с соблюдением графика учебы. Сначала я попытался сократить его с часа в день до 30 минут. Однако я все еще не мог сосредоточиться из-за стресса, связанного с поиском работы. Я решил отказаться от него на время и пообещал забрать его обратно, как только получу новую работу, что я и сделал. Дайте себе передышку, но знайте, что вам все равно придется попытаться вернуться к ней.

Вы иммигрировали из Ирана в США. Можете ли вы дать совет другим специалистам, которые эмигрируют в поисках работы?

Получить рабочую визу может быть очень сложно, особенно если вы приезжаете в США. Получить студенческую визу проще. Однако, будучи студентом, вам не разрешается работать за пределами кампуса. Это дает вам узкое окно, чтобы найти работу в реальном мире, прежде чем вы закончите. У меня были проблемы с получением каких-либо интервью, просто подав заявку и отправив свое резюме, потому что отделы по найму просто добавляют ваше к куче.

Итак, я зашел на LinkedIn и связался со всеми, кого мог найти работающими в компаниях, которые мне показались интересными. Я бы сказал что-то вроде: «Я видел, что в вашей компании открыта вакансия. Если я дам вам свое резюме, вы можете послужить моей рекомендацией?» Я писал по электронной почте примерно 200 людям в день, и примерно 40 процентов отвечали.

В нашей отрасли много иммигрантов, и многие из них сочувствовали мне и очень помогали. После интервью, независимо от того, как оно прошло, я говорил спасибо и старался оставаться на связи. Я также стараюсь делать то же самое для других. Я даю рекомендации, когда люди спрашивают меня в LinkedIn. Я также рассмотрю резюме для тех, кто спрашивает.

Насколько приветлива индустрия искусственного интеллекта к вам как к женщине?

Я думаю, что сейчас самое время быть женщиной в сфере технологий. Все заинтересованы в увеличении разнообразия, поэтому, если вы женщина, люди с большей готовностью дадут вам шанс. У нас также есть свои конференции, такие как Праздник Грейс Хоппер каждый год в Орландо. Это отличный ресурс для общения с 25 000 других женщин в нашей отрасли, работающих в компаниях любого размера.

Есть ли у вас какие-либо другие советы для людей, которые надеются начать карьеру в области ИИ?

Я всегда говорю людям, что лучшая отправная точка — научиться программировать на Python. Если вы хотите стать специалистом по данным, вы никогда не должны прекращать изучать статистику.

Какова ваша следующая карьерная цель и как вы работаете над ее достижением?

Я пытаюсь стать экспертом по трансформерам, потому что они захватывают мир НЛП. Я читаю и посещаю курсы по 45 минут каждый день. Для начала я изучаю потрясающую книгу Франсуа Шолле Глубокое обучение с помощью Python. Я также закончил 4 из 5 курсов Специализации глубокого обучения, а также проходил Специализацию НЛП.

Я читал статьи Джея Аламмара о НЛП, все они потрясающие, а также любые соответствующие статьи на towardsdatascience.com и medium.com. Остальное время уходит на реализацию того, чему я научился, работая над своими проектами.

Хотите укрепить свои знания и пройти каждое собеседование? Записаться на специализацию Deep Learning