Xgboost в блоках данных Azure для начинающих.

Как запустить xgboost в кластере Azure Databricks. когда я писал эту статью, xgboost уже был включен в бета-кластер Azure Databricks 4.1 ML с spark 2.3. Потребовалось некоторое время, чтобы понять это, поэтому я подумал о том, чтобы поделиться шагами, как начать работу с xgboost в лазурных блоках данных.

Предварительное требование: убедитесь, что у вас есть рабочая область Azure Databricks.

Шаг 1. Создайте новый кластер, выбрав Standard с версией Databricks Runtime версии 4.1 ML Beta (включая Apache spark 2.3.0, Scala 2.11). Я также выбрал Python 3.0. Я только создаю кластер из 2 узлов, расширяющийся до 5 узлов с 30-минутным тайм-аутом.

Шаг 2: подождите, пока кластер не заработает.

Шаг 3. Перейдите в свое рабочее пространство, щелкните пользователей и создайте каталог для хранения блокнота.

Шаг 4: Нажмите стрелку вниз на верхней панели, где вы видите имя каталога, и выберите «Импорт», а затем выберите «URL».

Шаг 5. Скопируйте этот URL-адрес https://docs.azuredatabricks.net/_static/notebooks/xgboost.html и вставьте в текстовое поле, а затем нажмите Импорт.



Шаг 6: Запускайте каждую ячейку, учитесь и получайте удовольствие.

Примечание. На данный момент библиотека xgboost установлена ​​в бета-кластере 4.1 ML, и со временем она может меняться, а также будет доступна в рабочей версии.

Развлекайся!.