Я пишу высокопараллельное многопоточное приложение. У меня уже есть класс потока с ускорением SSE. Если бы мне пришлось написать класс потока с ускорением MMX, а затем запустить оба потока одновременно (один поток SSE и один поток MMX на ядро), заметно ли улучшилась бы производительность?
Я бы подумал, что эта настройка поможет скрыть задержку памяти, но я хотел бы убедиться, прежде чем я начну вливать в нее время.