У меня есть VMSS с количеством экземпляров, скажем 3. Допустим, я указал, что если загрузка ЦП составляет <20%, то уменьшите экземпляр с 3 до 1. Предположим, что эти 3 экземпляра обслуживали некоторый запрос, и скажем, каждый запрос занимает 60 секунд. .
Предположим, что в этот момент загрузка ЦП достигла 15%, поэтому количество экземпляров должно уменьшиться на 2. Итак, в этот момент что произойдет с существующим запросом, который обслуживается двумя другими экземплярами. Переносят ли эти экземпляры свой текущий процесс на другой, или счетчик не будет уменьшаться до тех пор, пока они не завершат текущий запрос?
Я уже подключил масштабируемый набор к шлюзу приложений и включил слив соединения, чтобы текущий процесс не прерывался. Но он падает. Поскольку это не удается, я пытаюсь что-то сделать, используя версию и версию управления API.
Ожидание: после того, как происходит уменьшение / масштабирование, текущие запросы не должны падать.