Главная | Обратная связь | Поможем написать вашу работу!
МегаЛекции

Инструкции Streaming SIMD Extensions 2




Важнейшим положительным нововведением нового процессора, которое действительно сможет поднять его над конкурентами, является использование второго поколения потоковых команд-расширений - SSE2 (Streaming SIMD Extensions 2), состоящий из 144 новых инструкций:

Набор из 76 совершенно новых команд поддерживает новые форматы упакованных данных и увеличивает производительность при целочисленных SIMD операциях при использовании 128-разрядных регистров.

Введены новые упакованные типы данных - с плавающей точкой с двойной точностью и несколько целочисленных 128-битных типов. Все новые типы данных позволяют производить действия с ними в XMM-регистрах.

Также усовершенствования коснулись 68 целочисленных SIMD инструкций, которые работали в процессорах Pentium II и Pentium III c 64-разрядными MMX-регистрами, в архитектуре Willamette поддерживают и работу c XMM-регистрами. Данное нововведение позволит разработчикам иметь большую гибкость при написании SIMD-кода, используя как MMX, так и XMM-регистры.

Очевидно, что данные усовершенствования позволят серьезно поднять производительность в таких приложениях, как кодирование/декодирование звука и видео, распознавание речи, а также получить определенный прирост в 3D-графике, научных и инженерных задачах благодаря двойной точности вычислений с плавающей точкой.

В дополнение к основным SIMD командам введено несколько новых инструкций, позволяющих программистам управлять кэшированием данных. Возможна предварительная выборка данных до того, как ими действительно надо будет пользоваться, и потоковая передача данных из/в регистры, не разрушая содержимое кэшей.

При этом инструкции SSE2 полностью основываются на SSE, не требуют поддержки операционной системой и, скорее всего, окажутся самым главным козырем процессора Willamette в борьбе за вершины производительности.

 

Системная шина

С выходом Willamette Intel вводит новую системную шину, которая должна значительно увеличить пропускную способность (тактовая частота 100 МГц, даже ниже, чем у существующего у Pentium III - 133 МГц GTL+, но за счет передачи 4 пакетов за такт, результирующая частота получается 400 МГц), она еще и становится связующим звеном между IA32 и IA64 - после Tehama, чипсета под Willamette, ее будет использовать i870 - чипсет, предназначенный как под IA32 Foster, так и под IA64 McKinley.

Таким образом, плюсы новой шины: значительно выросшая пропускная способность - 3.2 Гбайт/с (400 МГц, 64 бит) против 1,064 Гбайт/с (266 МГц, 64-бит) у шины PIII 133 МГц GTL+ (3.2 Гбайт/с - как раз ровно столько, сколько будет способен обеспечить двухканальный RDRAM, на который рассчитан Tehama.

Первоначально процессоры были рассчитаны на установку в Socket 423, затем Intel для этого семейства процессоров ввел Socket 478.

 

Следующим процессором в линейке Pentium 4 за Willamette идет Northwood. Единственное архитектурное отличие нового процессора от старого — 512КБ кэша L2 вместо 256КБ. Впрочем, реализация этого отличия стала возможной лишь вследствие перехода фабрик Intel на 0,13-микронную технологию производства с использованием медных соединений. В результате, на 200-миллиметровой пластине умещается вдвое больше кристаллов, чем при производстве по 0,18-микронной технологии. (В дальнейшем же, с переходом на 300-миллиметровые пластины, это количество увеличится еще в 2,5 раза.) Ну а следствием нового техпроцесса станут, совершенно очевидно, более высокая допустимая частота процессоров и пониженное тепловыделение (49,8Вт TDP у 2,2-гигагерцовой версии Northwood против 75Вт у Willamette 2ГГц). Любопытно отметить, что процессор на новом ядре содержит 55 миллионов транзисторов (площадь — 146мм2), из которых около 40% приходится на кэш (у Willamette 42 миллиона транзисторов, а изменился только объем L2).

 

.

 

 

Поделиться:





Читайте также:





Воспользуйтесь поиском по сайту:



©2015 - 2024 megalektsii.ru Все авторские права принадлежат авторам лекционных материалов. Обратная связь с нами...