Я пытаюсь профилировать код для времени выполнения на процессоре x86-64. Я имею в виду этот технический документ Intel, а также просмотрены другие потоки SO, в которых обсуждается тема использования RDTSCP и CPUID+RDTSC здесь и здесь.
В упомянутом выше техническом документе метод с использованием CPUID+RDTSC назван ненадежным, а также подтвержден статистикой.
В чем может быть причина ненадежности CPUID+RDTSC?
Кроме того, графики на рис. 1 (график поведения минимального значения) и рис. 2 (график поведения дисперсии) в том же техническом документе имеют паттерн «прямоугольная волна». Чем объясняется такая закономерность?