БАЗОВЫЙ XAI

БАЗОВЫЙ XAI с DALEX - Часть 5: Ценности Шепли

Введение в исследование модели с примерами кода для R и Python.

Добро пожаловать в серию «BASIC XAI с DALEX».

В этом посте мы представляем значения Шепли, метод, не зависящий от модели, который мы можем использовать для любого типа модели.

Доступны предыдущие части этой серии:

Итак, приступим?

Во-первых, какие ценности нам дает Шепли?

Величина Шепли - это метод, не зависящий от модели, мы можем использовать его для любого типа модели. Преимущество значений Шепли - свойство атрибуции аддитивных признаков. Это местное объяснение. Что такое единичное наблюдение, подумайте о пациенте, банке или телекоммуникационном клиенте. В предыдущей части BASIC XAI SERIES мы представили метод Break Down. Значение Шепли является обобщением, потому что в методе Break Down представляет собой один из всех переменных порядков. Теперь мы рассматриваем все заказы для переменных, поэтому, если у нас есть функции p в нашем наборе данных, то у нас есть заказы p!. Результатом является усреднение возможных заказов.

Второй - интуиция ценностей Шепли.

Аддитивные объяснения Шепли (SHAP) основаны на «ценностях Шепли», разработанных Шепли в теории кооперативных игр.

Метод значений Шепли основан на предсказаниях разбивки на части. Это немного другой подход, чем в методе Break Down. Он основан на идее усреднения входного значения данной переменной в целом или большого количества возможных заказов.

Важным практическим ограничением общего метода, не зависящего от модели, является то, что для больших моделей расчет значений Шепли занимает много времени. В конкретных ситуациях их можно рассчитать очень быстро. Например, для дополнительных моделей и для моделей на основе деревьев.

В-третьих, давайте создадим модель на R и Python.

Напишем код. Мы все еще работаем над данными DALEX квартир. Для вычисления метода значений Шепли мы используем функцию pred_parts () с type = ‘shap’. Нам нужен объясняющий объект и наблюдение, для которого мы хотим вычислить объяснение.

Посмотрим теперь на участок под квартиру, рассмотренную в предыдущем блоге. Наибольшее влияние на цену квартиры оказывает район Охота, он находится недалеко от центра города. Однако на цену негативно влияет то, что квартира находится не в районе Средместье - центре города. Более того, число этажа, равное 7, и площадь 93 метра в квадрате имеют отрицательный вклад в цену.

Большое спасибо Пшемыславу Биецеку и Якубу Висьневскому за их поддержку в этом блоге.

Если вас интересуют другие сообщения об объяснимом, справедливом и ответственном машинном обучении, подпишитесь на #ResponsibleML на Medium.

Чтобы увидеть больше материалов, связанных с R, посетите https://www.r-bloggers.com