Диаграмма дерева классификации от H2O Mojo/Pojo

Этот вопрос во многом основан на решении этот вопрос как отправная точка. Учитывая, что я могу использовать R для создания объекта модели mojo:

library(h2o)
h2o.init()
airlinedf <- h2o.importFile("http://s3.amazonaws.com/h2o-public-test-data/smalldata/airlines/allyears2k_headers.zip")
airlinemodel <- h2o.gbm(model_id = "airlinemodel",
                training_frame = airlinedf,
                x = c("Year", "Month", "DayofMonth", "DayOfWeek", "UniqueCarrier"),
                y = "IsDepDelayed",
                max_depth = 3,
                ntrees = 5)
h2o.download_mojo(airlinemodel, getwd(), FALSE)

И bash/graphviz для создания древовидной диаграммы этой модели:

java -cp h2o.jar hex.genmodel.tools.PrintMojo --tree 0 -i airlinemodel.zip -o airlinemodel.gv
dot -Tpng airlinemodel.gv -o airlinemodel.png

Мой вопрос состоит из трех частей:

Как мне объяснить значения и решения в этой визуализации и значения в конечных узлах? Какие НП относятся ко второму уровню? Если значения в конечных узлах являются «вероятностями классов», как они могут быть отрицательными?
1. Есть ли способ визуализировать или концептуализировать «сводное дерево» всех деревьев в модели?
2. Как я могу создать диаграмму, чтобы использовать цвет или форму для обозначения назначений бинарной классификации элементов в конечном узле?

r h2o gbm graphviz

RealViaCauchy 19.11.2018 источник

comment

для вашего первого вопроса, пожалуйста, взгляните на этот вопрос, который задал то же самое: stats.stackexchange.com/questions/374569/. Благодарность! - Lauren 20.11.2018

Ответы (1)

arrow_upward
-1
arrow_downward

Существует лучший способ построения деревьев решений с помощью H2O — без извлечения MOJO и выхода из R/Python — с использованием нового Tree API (начиная с версии 3.22.0.1). Для исчерпывающих пояснений см.:

topchef 29.12.2018

Диаграмма дерева классификации от H2O Mojo/Pojo

Ответы (1)

Вопросы по теме