Диаграмма дерева классификации от H2O Mojo/Pojo

Этот вопрос во многом основан на решении этот вопрос как отправная точка. Учитывая, что я могу использовать R для создания объекта модели mojo:

library(h2o)
h2o.init()
airlinedf <- h2o.importFile("http://s3.amazonaws.com/h2o-public-test-data/smalldata/airlines/allyears2k_headers.zip")
airlinemodel <- h2o.gbm(model_id = "airlinemodel",
                training_frame = airlinedf,
                x = c("Year", "Month", "DayofMonth", "DayOfWeek", "UniqueCarrier"),
                y = "IsDepDelayed",
                max_depth = 3,
                ntrees = 5)
h2o.download_mojo(airlinemodel, getwd(), FALSE)

И bash/graphviz для создания древовидной диаграммы этой модели:

java -cp h2o.jar hex.genmodel.tools.PrintMojo --tree 0 -i airlinemodel.zip -o airlinemodel.gv
dot -Tpng airlinemodel.gv -o airlinemodel.png

Пример древовидной диаграммы GBM Мой вопрос состоит из трех частей:

  1. Как мне объяснить значения и решения в этой визуализации и значения в конечных узлах? Какие НП относятся ко второму уровню? Если значения в конечных узлах являются «вероятностями классов», как они могут быть отрицательными?

    1. Есть ли способ визуализировать или концептуализировать «сводное дерево» всех деревьев в модели?

    2. Как я могу создать диаграмму, чтобы использовать цвет или форму для обозначения назначений бинарной классификации элементов в конечном узле?


person RealViaCauchy    schedule 19.11.2018    source источник
comment
для вашего первого вопроса, пожалуйста, взгляните на этот вопрос, который задал то же самое: stats.stackexchange.com/questions/374569/. Благодарность!   -  person Lauren    schedule 20.11.2018


Ответы (1)


Существует лучший способ построения деревьев решений с помощью H2O — без извлечения MOJO и выхода из R/Python — с использованием нового Tree API (начиная с версии 3.22.0.1). Для исчерпывающих пояснений см.:

  1. Проверка деревьев решений с помощью H2O
  2. Наконец-то вы можете строить деревья решений H2O в R
person topchef    schedule 29.12.2018