Итак, почему экзамен Сертифицированный специалист по данным Google Cloud Professional?

Облако - это место назначения для ваших проектов в области больших данных и машинного обучения. В условиях перехода к миру «прежде всего искусственный интеллект» облако позволяет как частным лицам, так и компаниям легко экспериментировать с решениями искусственного интеллекта. Если вы хотите развиваться как профессионал в области облачного / машинного обучения или просто хотите узнать больше о том, как работает искусственный интеллект, сертификаты Google Cloud - отличный инструмент / квалификация, которые помогут вам продвинуться в этом пути.

Об этом говорится в однострочном письме Google.

Продемонстрируйте свои навыки проектирования и создания систем обработки данных и создания моделей машинного обучения на платформе Google Cloud Platform.

Я сдал экзамен в октябре 2019 года, проучившись два месяца - я не занимаюсь программированием днем ​​и у меня нет опыта работы более трех лет, рекомендованного Google для сдачи этого экзамена. Вот почему я готовился дополнительно к этому экзамену, и в некоторой степени я думаю усерднее, чем необходимо. Вам просто нужно подготовиться прямо к этому экзамену. Вот почему я решил сопоставить некоторые из моих учебных опытов, чтобы помочь вам достичь целевого обучения. Не поймите меня неправильно, это не ярлык - он не облегчает экзамен, а просто помогает повысить вероятность его успеха. Если вы уже знакомы с основами, прокрутите вниз, чтобы узнать, как сдать экзамен по инженерии данных.

Что нужно для подготовки к экзамену?

Если вы думали о получении сертификата в Google Cloud, но не уверены, имеете ли вы квалификацию, вы должны знать несколько вещей. Во-первых, вам совершенно не обязательно быть инженером-программистом, но вам нужно иметь некоторый опыт программирования - вам нужно хотя бы понимать, как работает кодирование, что такое объектно-ориентированное программирование, принципы работы компьютерных систем и основы жизненного цикла разработки системы, от разработки кода, подготовки к запуску и развертывания. Во-вторых, это не один из тех экзаменов, которые вы можете легко сдать. Будет тонна содержания и теоретических знаний, которые вам необходимо усвоить, усвоить и запомнить. Кроме того, вам нужно совместить это с практическими знаниями, потому что все вопросы на экзамене представлены в форме тематического исследования. И наконец, для экзамена Professional Data Engineer рекомендуется 3+ года опыта работы в отрасли и более 1 года разработки и управления решениями с использованием GCP - и, как уже упоминалось, у меня нет ни одного из них. Не поймите меня неправильно, экзамен определенно непростой, а вопросы очень сложные. Но в конечном итоге все сводится к вашему уровню понимания каждого продукта GCP и способности разбивать проблемы на экзамене, чтобы решить реальную проблему, которую они задают.

Какой формат экзамена?

Экзамен будет состоять из 50 вопросов с несколькими вариантами ответов, и вам потребуется проходной балл 80%. Google не сообщит вам, каков ваш результат - только если вы «прошли» или «не прошли» - без каких-либо дополнительных комментариев или отзывов. Вопросы - это непросто, каждый вопрос сам по себе представляет собой тематическое исследование или вариант использования, который вам нужно будет решить. Обычно ответ заключается в разработке решения, включающего комбинацию продуктов GCP. Следовательно, очень важно понимать, как используется каждый продукт, когда они используются друг с другом и как данные передаются между разными продуктами.

Сколько стоит экзамен?

Экзамен будет стоить 200 долларов США и действителен только в течение двух лет. После этого вам нужно будет пересдать экзамен, чтобы сохранить квалификацию. Но - если вы создали для себя портфолио за это время, ваш опыт будет квалифицировать вас больше, чем любая сертификация.

Если вы провалите экзамен с первого раза, вам придется подождать две недели, прежде чем пересдать его, и вам придется снова заплатить. Если вы потерпите неудачу во второй раз, время ожидания увеличится до 60 дней, а в третий раз вам придется подождать 365 дней перед повторной попыткой.

Как я готовился к экзамену?

В оставшейся части этой статьи я расскажу, как я готовился к сертификационному экзамену GCP Professional Data Engineer в течение двух месяцев, обо всех ресурсах, с которыми я консультировался, и о том, через что я прошел. Я хотел бы отметить, что облако не всегда связано с большими данными и машинным обучением, большинство компаний в настоящее время используют облако для хостинга, хранения данных или управления ИТ-системами. Однако, особенно на недавних экзаменах инженера данных, Google огромен в области машинного обучения. На ML легко возникает 40–50% вопросов (от базовых теорий о том, что такое регулирование L1 / L2, кросс-энтропия и т. Д .; до вариантов использования компанией в конкретных сценариях, например, обучите ли вы модель ИИ индивидуально или воспользуетесь одной из них. готовых моделей GCP на платформе AI и т. д.)

1. Я начал с Coursera: Data Engineering, Big Data и Machine Learning on GCP Specialization:

Необходимое время: около 4+ недель из 20 часов учебной недели
Готовность к экзамену по завершении: 40%
Цена : 49 долларов США в месяц с 7-дневной пробной версией

Этот курс является хорошим введением в платформу Google Cloud Platform, какие продукты существуют и для чего они нужны. Это сочетание презентаций, демонстраций и практических занятий, участники узнают, как проектировать системы обработки данных, строить сквозные конвейеры данных, анализировать данные и выполнять машинное обучение. Курс охватывает структурированные, неструктурированные и потоковые данные. Одной Coursera явно недостаточно для сдачи экзамена - полагайтесь не только на учебные материалы и Coursera, но и на собственный опыт разработки с помощью практических Qwiklabs.

И учтите, что в этом курсе много информации, особенно для тех, кто плохо знаком с GCP. На самом деле я остановился на полпути, просто чтобы перевести дух в море информации, и нашел другой курс, который дает вам исчерпывающий обзор всех продуктов за гораздо более короткий промежуток времени. См. ниже.

2. Затем я нашел и прошел Экспресс-курс Google Cloud Professional Data Engineer Express от Сэма Ли:

Необходимое время: 4,5 часа
Готовность к экзамену по завершении: 20%
Цена: 24,99 канадских долларов / пожизненный доступ с поддержка сообщества

Этот курс рассчитан на 5 часов и познакомит вас со всеми основными продуктами, которые вам нужно знать для экзамена. Это короткий и интересный ресурс, который даст вам полную картину того, что вам нужно знать по каждому продукту на экзамене. Я человек большой картины, поэтому прохождение этого курса действительно помогло мне получить представление о том, чем именно я собираюсь заниматься, прежде чем я перейду к деталям.

3. Затем я закончил Курс Data Engineer Course в Linux Academy, подготовленный Мэтью Уласиеном.

Необходимое время: более 20 часов
Готовность к экзамену по завершении: 80%
Цена: 49 долларов США в месяц с 7-дневная пробная версия

Надо сказать, что это феноменальный ресурс. В этом курсе 73 видеоролика, 6 практических лабораторных работ и 7 практических викторин / экзаменов. Обратите внимание, что некоторые практические вопросы в этом курсе фактически появляются на экзамене. К этому курсу прилагается Электронная книга Data Dossier (по сути, подборка материалов курса), которая в основном похожа на подробную шпаргалку для всех систем.

Я бы сказал, что этих трех ресурсов достаточно, чтобы предоставить вам большую часть контента, который вам нужно знать для экзамена. Однако не следует просто полагаться на видео - особенно если у вас нет большого опыта работы с Google Cloud - единственный способ скрыть это - действительно получить больше практического практического опыта с помощью Qwiklabs. Фактически, Google Cloud Platform предоставляет бесплатный кредит в размере 300 долларов для всех, кто зарегистрируется для использования ее продуктов. Максимально используйте игровые площадки, чтобы по-настоящему почувствовать, каково это работать в окружающей среде, потому что у вас действительно есть много рабочих вопросов.

А теперь о главном приеме, который помог мне успешно сдать экзамен. Если вы выполните именно те действия, которые я описал в разделе «Как решить» ниже, у вас не должно возникнуть проблем со сдачей экзамена. После изучения всех материалов и сдачи экзамена я понял, что на самом деле есть только три типа вопросов и, следовательно, три типа подхода, которые вам нужно использовать, чтобы ответить на эти вопросы:

  1. Вопросы о функциональности продукта (около 20–30%)
    Примеры экзаменационных вопросов: ваша компания передает потоковые датчики LoT, какие продукты вы бы использовали для разработки конвейер данных? Вам нужны облачные системы хранения данных, поддерживающие JSON и ANSI SQL. Какой продукт вам следует использовать?
    Как решить: Пройти все курсы на Coursera или Linux будет больше чем достаточно, чтобы помочь вам добраться до этого уровня.
  2. Вопросы о работе продукта (около 30–40%)
    Примеры экзаменационных вопросов: что делать, если данные визуализации не отображаются в Студии данных? Какой прокси вы используете для доступа к веб-интерфейсу YARN? Этот запрос возвращает ошибку. Что делать, чтобы ее исправить?
    Как решить: суть вопроса этого типа - лучшие практики. Есть две части, чтобы решить эту проблему. Один играет с платформой, взаимодействует с ней и знает настройки и параметры переключения. Не волнуйтесь, вам не придется днями заниматься Qwiklabs. Просто посмотрите подробно все практические видео в Linux Academy, определите системы, с которыми вы менее знакомы или считаете более сложными, и выполните для них Qwiklabs. Если вы ограничены во времени, вам действительно не нужно проходить все лабораторные работы. Я вообще не трогал лаборатории Coursera. Кроме того, пройдите практические экзамены, просматривая документацию GCP, чтобы понять, какие рекомендуемые методы. Вот несколько примеров документации:
    Лучшие практики BigQuery,
    Краткое содержание Stackdriver,
    BigTable и понимание того, как создать хорошую схему
    IAM, чтобы познакомиться с основные концепции и роли
    Большой список дампов ресурсов от Ivam Luz
  3. Общие вопросы по машинному обучению (около 20–30%)
    Примеры экзаменационных вопросов:
    какие параметры настраиваются нейронной сетью во время обучения? Ваша компания хочет прогнозировать цены на акции, какую модель машинного обучения вы бы обучили? Показан график точек данных. Какое уравнение вам нужно для их кластеризации (например, cos (X) или X² + Y²)?
    Как решить: учебный материал готов я собираюсь сократить это. Некоторые из этих вопросов не относятся к Linux или Coursera. Вам нужно провести собственное исследование. Не волнуйтесь об этом слишком сильно - вы, вероятно, сможете ответить на большинство этих вопросов, узнав о том, как работают TensorFlow, продукты искусственного интеллекта GCP и предварительно обученные модели. Вот несколько основных областей, которые могут быть полезны на моем экзамене в октябре 2019 года:
    Как исправить переоснащение / недостаточное оснащение
    Знайте, что такое методы отсева
    Понять регуляризацию L1 / L2
    Понимание синтетических функций
    API машинного обучения Google (ML)
    Механизм машинного обучения Google Cloud
    TPU Google Cloud
    Глоссарий Google терминов ML

Как узнать, что вы готовы к экзамену?

Комфорт. Представьте, что вы сидите на экзамене и у вас есть вопрос по BigQuery. Тогда у вас есть вопрос по Pub / Sub. Затем один о машинном обучении. Насколько вы нервничаете? Если вы чувствуете себя хорошо, потому что хорошо разбираетесь в них, скорее всего, вы готовы к экзамену.

Напишите практические экзамены. Я не могу не подчеркнуть этого достаточно - практические экзамены очень, очень важны. Я лично проходил практические вопросы по Linux и Google снова и снова, чтобы убедиться, что я хорошо понял ответы, и переписывал экзамены, пока не набирал 95% + каждый раз. Вот пакет практических экзаменационных вопросов, который я нашел на Udemy, который я также нашел полезным (некоторые вопросы действительно появлялись на экзамене аналогичным образом).

Примечание: когда в вопросе предлагаются два варианта: продукт GCP или продукт, не являющийся продуктом GCP, ответ обычно заключается в том, чтобы выбрать собственное решение GCP. Всегда выбирайте самый дешевый вариант, если не указано иное.

Если хотите, вот также некоторые другие ресурсы, которые, как я знаю, существуют, но лично не исследовали:

Фактически экзамен длится два часа, и это заняло у меня примерно столько же времени. Я бы сказал, если вы выполнили все целевое обучение, которое я описал выше, и прошли практические экзамены, настоящий экзамен не должен быть таким сложным. Вы получите свои результаты почти сразу после экзамена (вам нужно будет проверить веб-эксперта, если вы не получили электронное письмо с сертификатом, потому что на его обработку иногда уходит до пары дней).

Если у вас есть вопросы по экзамену, напишите мне в Twitter (@sodiumsun) или LinkedIn. Если вам нужна копия практических вопросов Udemy (которые я заплатил на Udemy, но с радостью делюсь бесплатно), вы также можете написать мне или загрузить их прямо здесь.