В [1] представлен простой и эффективный деформируемый модуль самоконтроля и построена на нем прочная пирамидальная основа, которая представляет собой деформируемый преобразователь внимания (DAT), полезный для классификации изображений и других сложных задач прогнозирования.

Они особенно обеспечивают деформируемое внимание для правильного моделирования взаимодействия между токенами под контролем важных областей карт функций. Несколько наборов искаженных точек выборки используются для определения этих концентрированных областей, которые извлекаются из запросов офсетной сетью.