Этот вопрос во многом основан на решении этот вопрос как отправная точка. Учитывая, что я могу использовать R для создания объекта модели mojo:
library(h2o)
h2o.init()
airlinedf <- h2o.importFile("http://s3.amazonaws.com/h2o-public-test-data/smalldata/airlines/allyears2k_headers.zip")
airlinemodel <- h2o.gbm(model_id = "airlinemodel",
training_frame = airlinedf,
x = c("Year", "Month", "DayofMonth", "DayOfWeek", "UniqueCarrier"),
y = "IsDepDelayed",
max_depth = 3,
ntrees = 5)
h2o.download_mojo(airlinemodel, getwd(), FALSE)
И bash/graphviz для создания древовидной диаграммы этой модели:
java -cp h2o.jar hex.genmodel.tools.PrintMojo --tree 0 -i airlinemodel.zip -o airlinemodel.gv
dot -Tpng airlinemodel.gv -o airlinemodel.png
Мой вопрос состоит из трех частей:
Как мне объяснить значения и решения в этой визуализации и значения в конечных узлах? Какие НП относятся ко второму уровню? Если значения в конечных узлах являются «вероятностями классов», как они могут быть отрицательными?
Есть ли способ визуализировать или концептуализировать «сводное дерево» всех деревьев в модели?
Как я могу создать диаграмму, чтобы использовать цвет или форму для обозначения назначений бинарной классификации элементов в конечном узле?