Вопросы по теме 'sse4'

Инструкция MOVDQU + граница страницы
У меня есть простая тестовая программа, которая загружает регистр xmm с инструкцией movdqu для доступа к данным через границу страницы (OS = Linux). Если отображается следующая страница, это работает нормально. Если он не сопоставлен, я получаю...
1041 просмотров
schedule 01.11.2021

Как включить набор инструкций SSE4.2 в Visual C++?
Я использую дескриптор BRIEF в OpenCV в Visual C++ 2010 для сопоставления точек на двух изображениях. В статье о BRIEF-дескрипторе написано, что можно ускорить вещи: «Дескриптор BRIEF использует расстояние Хэмминга, что может быть сделано...
3850 просмотров
schedule 06.08.2022

встроенный pcmpistri не работает в gcc
Я пытаюсь написать версию strcmp , в которой используются новые инструкции SSE4.2, использующие встроенные функции GCC. Это код, который у меня есть до сих пор: #include <stdio.h> #include <smmintrin.h> int main(int argc, char...
400 просмотров
schedule 13.08.2022

В чем разница между __popcnt() и _mm_popcnt_u32()?
MS Visual C++ поддерживает 2 варианта инструкции popcnt на процессорах с SSE4.2: __popcnt() _mm_popcnt_u32() Единственное отличие, которое я обнаружил, заключалось в том, что документы для __popcnt() помечены как «Специфические...
6165 просмотров
schedule 19.03.2023

Как включить поддержку инструкции POPCNT/internal на моем компьютере?
Я попытался запустить следующую программу на своем компьютере (Fedora 17 32bit). Как включить в моей системе поддержку инструкции popcnt для быстрого подсчета населения? #include <stdio.h> #include <nmmintrin.h> int main(void) {...
20837 просмотров
schedule 29.05.2023

Как работает встроенная функция _mm_cmpgt_epi64
Я использую встроенную функцию _mm_cmpgt_epi64 для реализации 128-битного сложения, а затем 256-битного. Глядя на результат этого внутреннего чего-то, я озадачен. Я не понимаю, почему вычисленная маска такая, какая она есть. const __m128i...
181 просмотров
schedule 24.03.2023

Выгодно ли использовать glibc strlen()/strcmp() или создавать свои собственные на основе SSE4.2?
Согласно Schema Validation with Intel® Streaming SIMD Extensions 4 (Intel® SSE4) (Intel, 2008 г.) [они] добавили инструкции, облегчающие поиск символов и сравнение двух операндов по 16 байт за раз. Я написал несколько основных функций strlen() и...
125 просмотров
schedule 28.06.2023