Theres - это пара мест в моей базе кода, где одна и та же операция повторяется очень много раз для большого набора данных. В некоторых случаях это занимает значительное время, чтобы обработать их.
Я считаю, что использование SSE для реализации этих циклов должно значительно повысить их производительность, особенно когда многие операции выполняются в одном наборе данных, поэтому, как только данные сначала считываются в кеш, не должно быть никакого кеша промахивает, чтобы остановить его. Однако я не уверен в этом.
-
Есть ли способ компиляции и независимый от ОС способ записи кода, чтобы воспользоваться инструкциями SSE? Мне нравятся встроенные функции VС++, которые включают операции SSE, но я не нашел никаких кросс-компиляторов.
-
Мне все еще нужно поддерживать некоторый процессор, который либо не имеет, либо имеет ограниченную поддержку SSE (например, Intel Celeron). Есть ли способ избежать необходимости создавать разные версии программы, например, иметь какой-то "компоновщик времени выполнения", который связывает либо базовый, либо оптимизированный SSE код на основе процессора, запускающего его при запуске процесса?
-
Как насчет других расширений процессора, глядя на наборы инструкций различных процессоров Intel и AMD, есть несколько из них?