Вопросы по теме 'sse4'
Инструкция MOVDQU + граница страницы
У меня есть простая тестовая программа, которая загружает регистр xmm с инструкцией movdqu для доступа к данным через границу страницы (OS = Linux).
Если отображается следующая страница, это работает нормально. Если он не сопоставлен, я получаю...
1041 просмотров
schedule
01.11.2021
Как включить набор инструкций SSE4.2 в Visual C++?
Я использую дескриптор BRIEF в OpenCV в Visual C++ 2010 для сопоставления точек на двух изображениях.
В статье о BRIEF-дескрипторе написано, что можно ускорить вещи:
«Дескриптор BRIEF использует расстояние Хэмминга, что может быть сделано...
3850 просмотров
schedule
06.08.2022
встроенный pcmpistri не работает в gcc
Я пытаюсь написать версию strcmp , в которой используются новые инструкции SSE4.2, использующие встроенные функции GCC.
Это код, который у меня есть до сих пор:
#include <stdio.h>
#include <smmintrin.h>
int main(int argc, char...
400 просмотров
schedule
13.08.2022
В чем разница между __popcnt() и _mm_popcnt_u32()?
MS Visual C++ поддерживает 2 варианта инструкции popcnt на процессорах с SSE4.2:
__popcnt()
_mm_popcnt_u32()
Единственное отличие, которое я обнаружил, заключалось в том, что документы для __popcnt() помечены как «Специфические...
6165 просмотров
schedule
19.03.2023
Как включить поддержку инструкции POPCNT/internal на моем компьютере?
Я попытался запустить следующую программу на своем компьютере (Fedora 17 32bit). Как включить в моей системе поддержку инструкции popcnt для быстрого подсчета населения?
#include <stdio.h>
#include <nmmintrin.h>
int main(void)
{...
20837 просмотров
schedule
29.05.2023
Как работает встроенная функция _mm_cmpgt_epi64
Я использую встроенную функцию _mm_cmpgt_epi64 для реализации 128-битного сложения, а затем 256-битного. Глядя на результат этого внутреннего чего-то, я озадачен.
Я не понимаю, почему вычисленная маска такая, какая она есть.
const __m128i...
181 просмотров
schedule
24.03.2023
Выгодно ли использовать glibc strlen()/strcmp() или создавать свои собственные на основе SSE4.2?
Согласно Schema Validation with Intel® Streaming SIMD Extensions 4 (Intel® SSE4) (Intel, 2008 г.) [они] добавили инструкции, облегчающие поиск символов и сравнение двух операндов по 16 байт за раз. Я написал несколько основных функций strlen() и...
125 просмотров
schedule
28.06.2023