Xgboost в блоках данных Azure для начинающих.
Как запустить xgboost в кластере Azure Databricks. когда я писал эту статью, xgboost уже был включен в бета-кластер Azure Databricks 4.1 ML с spark 2.3. Потребовалось некоторое время, чтобы понять это, поэтому я подумал о том, чтобы поделиться шагами, как начать работу с xgboost в лазурных блоках данных.
Предварительное требование: убедитесь, что у вас есть рабочая область Azure Databricks.
Шаг 1. Создайте новый кластер, выбрав Standard с версией Databricks Runtime версии 4.1 ML Beta (включая Apache spark 2.3.0, Scala 2.11). Я также выбрал Python 3.0. Я только создаю кластер из 2 узлов, расширяющийся до 5 узлов с 30-минутным тайм-аутом.
Шаг 2: подождите, пока кластер не заработает.
Шаг 3. Перейдите в свое рабочее пространство, щелкните пользователей и создайте каталог для хранения блокнота.
Шаг 4: Нажмите стрелку вниз на верхней панели, где вы видите имя каталога, и выберите «Импорт», а затем выберите «URL».
Шаг 5. Скопируйте этот URL-адрес https://docs.azuredatabricks.net/_static/notebooks/xgboost.html и вставьте в текстовое поле, а затем нажмите Импорт.
Шаг 6: Запускайте каждую ячейку, учитесь и получайте удовольствие.
Примечание. На данный момент библиотека xgboost установлена в бета-кластере 4.1 ML, и со временем она может меняться, а также будет доступна в рабочей версии.
Развлекайся!.