БАЗОВЫЙ XAI
БАЗОВЫЙ XAI с DALEX - Часть 5: Ценности Шепли
Введение в исследование модели с примерами кода для R и Python.
Добро пожаловать в серию «BASIC XAI с DALEX».
В этом посте мы представляем значения Шепли, метод, не зависящий от модели, который мы можем использовать для любого типа модели.
Доступны предыдущие части этой серии:
- БАЗОВЫЙ XAI с DALEX - Часть 1: Введение.
- БАЗОВЫЙ XAI с DALEX - Часть 2: Важность переменных на основе перестановок.
- БАЗОВЫЙ XAI с DALEX - Часть 3: Профиль частичной зависимости
- БАЗОВЫЙ XAI с DALEX - Часть 4: Метод разбивки
Итак, приступим?
Во-первых, какие ценности нам дает Шепли?
Величина Шепли - это метод, не зависящий от модели, мы можем использовать его для любого типа модели. Преимущество значений Шепли - свойство атрибуции аддитивных признаков. Это местное объяснение. Что такое единичное наблюдение, подумайте о пациенте, банке или телекоммуникационном клиенте. В предыдущей части BASIC XAI SERIES мы представили метод Break Down. Значение Шепли является обобщением, потому что в методе Break Down представляет собой один из всех переменных порядков. Теперь мы рассматриваем все заказы для переменных, поэтому, если у нас есть функции p в нашем наборе данных, то у нас есть заказы p!. Результатом является усреднение возможных заказов.
Второй - интуиция ценностей Шепли.
Аддитивные объяснения Шепли (SHAP) основаны на «ценностях Шепли», разработанных Шепли в теории кооперативных игр.
Метод значений Шепли основан на предсказаниях разбивки на части. Это немного другой подход, чем в методе Break Down. Он основан на идее усреднения входного значения данной переменной в целом или большого количества возможных заказов.
Важным практическим ограничением общего метода, не зависящего от модели, является то, что для больших моделей расчет значений Шепли занимает много времени. В конкретных ситуациях их можно рассчитать очень быстро. Например, для дополнительных моделей и для моделей на основе деревьев.
В-третьих, давайте создадим модель на R и Python.
Напишем код. Мы все еще работаем над данными DALEX квартир. Для вычисления метода значений Шепли мы используем функцию pred_parts () с type = ‘shap’. Нам нужен объясняющий объект и наблюдение, для которого мы хотим вычислить объяснение.
Посмотрим теперь на участок под квартиру, рассмотренную в предыдущем блоге. Наибольшее влияние на цену квартиры оказывает район Охота, он находится недалеко от центра города. Однако на цену негативно влияет то, что квартира находится не в районе Средместье - центре города. Более того, число этажа, равное 7, и площадь 93 метра в квадрате имеют отрицательный вклад в цену.
Большое спасибо Пшемыславу Биецеку и Якубу Висьневскому за их поддержку в этом блоге.
Если вас интересуют другие сообщения об объяснимом, справедливом и ответственном машинном обучении, подпишитесь на #ResponsibleML на Medium.
Чтобы увидеть больше материалов, связанных с R, посетите https://www.r-bloggers.com