Главная | Обратная связь | Поможем написать вашу работу!
МегаЛекции

Смешанная и разделенная кэш-память.

Внутренняя кэш-память использовалась ранее как для инструкций(команд), так и для данных. Такая память называлась смешанной, а ее архитектура – Принстонской, в которой в единой кэш-памяти, в соответствии с классическими принципами фон Неймана, хранились и команды и данные.

Сравнительно недавно стало обычным разделять кэш-память на две – отдельно для инструкций и отдельно для данных.

Преимуществом смешанной кэш-памяти является то, что при заданном объеме, ей свойственна более высокая вероятность попаданий, по сравнению с разделенной, поскольку в ней автоматически устанавливается оптимальный баланс между инструкциями и данными. Если в выполняемом фрагменте программы обращения к памяти связаны, в основном, с выборкой инструкций, а доля обращений к данным относительно мала, кэш-память имеет тенденцию заполнения инструкциями и наоборот.

С другой стороны, при раздельной кэш-памяти, выборка инструкций и данных может производиться одновременно, при этом исключаются возможные конфликты. Последнее особенно существенно в системах, использующих конвейеризацию команд, где процессор извлекает команды с опережением и заполняет ими буфер или конвейер.

Так, например, в процессоре Intel® 486 DX2 применялась смешанная кэш-память,

В Intel® Pentium® и в AMD Athlon™ с их суперскалярной организацией – раздельная. Более того, в этих процессорах помимо кэш-памяти инструкций и кэш-памяти данных используется также и адресная кэш-память. Этот вид кэша используется в устройствах управления памятью, в том числе для преобразования виртуальных адресов в физические.

Благодаря использованию нанотехнологий, для снижения потребляемой мощности, увеличения быстродействия ЭВМ(что достигается сокращением времени обмена данными между процессором и кэш-памятью) существует возможность, а более того имеются реальные примеры того, что кэш-память реализуют в одном кристале с процессором. Такая внутренняя кэш-память реализуется по технологии статического ОЗУ и является наиболее быстродействующей. Объем ее обычно составляет 64-128 Кбайт, причем дальнейшее увеличение ее объема приводит обычно к снижению быстродействия из-за усложнения схем управления и дешифрации адреса.

Альтернативой, широко применяемой в настоящее время, является вторая (внешняя) кэш-память большего объема, расположенная между внутренней кэш-памятью и ОП. В этой двухуровневой системе кэш-памяти, внутренней памяти отводится роль первого уровня L1, а внешней - второго L2. емкость L2 обычно на порядок и более выше, чем L1, а быстродействие и стоимость ниже. Память второго уровня также строится обычно как статическое ОЗУ. Емкость ее может составлять от 256 Кбайт до 1 Мбайта и технически реализуется как в виде отдельной микросхемы, однако может размещаться и на одном кристалле с процессором.

Самые современные процессоры от крупнейших производителей оснащаются сегодня кэш-памятью емкостью у Intel Pentium 4 на ядре Northwood - 512 Кбайт кэш-памяти L2, а процессоры Prescott будут выпускаться по 0,09-микронной технологии и получат кэш-память второго уровня удвоенного объема, который составит 1 Мбайт. Intel продолжает широко рекламировать свой "экстремальный" игровой процессор Pentium 4 Extreme Edition на основе модифицированного серверного ядра Gallatin с тактовой частотой 3,40 ГГц и кэш-памятью третьего уровня объемом 2 Мбайта. Она дополняет стандартный нортвудовский кэш L2 512 Кбайт и тоже работает на частоте ядра процессора (правда, с большей раза в два латентностью). Таким образом, в сумме новый Pentium 4 Extreme Edition имеет кэш-память объемом 2,5 Мбайт.

Дополнительная кэш-память третьего уровня ведет начало от серверных процессоров Xeon MP на 0,13-микронном ядре Gallatin и не имеет ничего общего с грядущим 90-нанометровым Prescott, однако этот кристалл (ядро) все же немного переработали с целью поддержки системной шины 800 МГц, уменьшения энергопотребления и др. и упаковали в стандартный корпус от текущих Pentium 4. В свою очередь AMD Athlon 64 и AMD Opteron работающие на более высокой частоте 2200 МГц, производятся по 0,13-микронной технологии (SOI) и содержат 105,9 млн. транзисторов и отличаются от предшествующих Athlon XP новым ядром с 64-битными возможностями вычислений (наряду с улучшенными 32-битными на базе прежнего ядра Athlon XP), кэш-памятью второго уровня объемом 1 Мбайт (причем кэш у Атлонов инклюзивный, то есть полный объем с учетом 128 Кбайт L1 составляет 1152 Кбайт).

При доступе к памяти, ЦП сначала обращается к кэш-памяти первого уровня. При промахе производится обращение к кэш-памяти второго уровня. Если информация отсутствует и в L2, производится обращение к ОП, и соответствующий блок заносится сначала в L2, а затем и в L1. Благодаря такой процедуре, часто запрашиваемая информация может быть легко восстановлена из кэш-памяти второго уровня.

Потенциальная экономия за счет применения L2 зависит от вероятности попаданий как в L1, так и L2. Однако, опыт Intel и AMD показывает, что использование кэш-памяти второго уровня существенно улучшает производительность. Именно поэтому во всех проанонсированых производителями новейших версиях процессоров применяется двухуровневая и даже трехуровневая организация кэш-памяти.

Некоторые данные по популярным и новейшим процессорам от Intel и AMD:

Pentium III

Процессор Intel® Pentium®III - процессор архитектуры P6, включает в себя: динамическое исполнение команд, системную шину с множественными транзакциями и технологию Intel MMX™ для обработки данных мультимедиа. Технология изготовления с разрешающей способностью 0.25 микрон позволяет разместить на кристалле более 9.5 миллионов транзисторов. Процессор содержит 32 Kб неблокируемой кэш-памяти первого уровня (16Кб/16Кб) и унифицированную неблокируемую кэш-память второго уровня емкостью 512 Кб, функционирующую на вдвое меньшей частоте, чем ядро. Процессор Intel® Pentium®III поддерживает кэширование памяти с объемом адресного пространства 4 Гб, и позволяет создавать масштабируемые системы с двумя процессорами и физической памятью объемом до 64 Гб.

Pentium IV

Процессор Pentium 4 устанавливает новый уровень производительности высокомощных микропроцессоров.

- Системная шина с частотой 800 МГц: 3,06 ГГц, 2,80 ГГц, 2,66 ГГц, 2,53 ГГц, 2,40B ГГц, 2,26 ГГц

- Технология гиперконвейерной обработки

- Механизм ускоренной обработки команд

- Кэш-память первого уровня с отслеживанием исполнения команд

- Кэш-память с улучшенной передачей данных

- Улучшенная система динамического исполнения команд

- Улучшенный блок вычислений с плавающей запятой и обработки мультимедиа

- Набор команд потоковых SIMD-расширений 2.

- У Intel Pentium 4 на ядре Northwood - 512 Кбайт кэш-памяти L2.

AMD-K6®-III

Процессор AMD-K6®-III, кодовое имя Sharptooth, в нем задействована встроенная быстродействующая кэш-память второго уровня (L2). В процессорный кристалл интегрированно 256 Кб кэш-памяти второго уровня, работающей на полной тактовой частоте процессора.

Процессор AMD-K6®-III содержит 21.3 миллиона транзисторов и производится по 0.25-микронной технологии на тактовые частоты 350, 380, 400 и 450 МГц. Объем кэш-памяти первого уровня (L1), как у всего семейства K6, равен 64Кб. Процессор AMD-K6®-III можно устанавливать в те же системные платы Super7™, что и AMD-K6®-2, при этом находящаяся на системной плате внешняя кэш-память 2 уровня превращается в кэш-память 3 уровня (L3), с которой процессор может общаться с внешней частотой 100 МГц.

AMD Athlon.

В настоящее время процессор AMD Athlon является самым быстрым процессором в мире. Процессор имеет следующие особенности:

Микроархитектура: Особенность процессора AMD Atlon™ - это девятипоточная суперскалярная архитектура оптимизованная для высоких частот. AMD Athlon™ содержит девять исполняемых потоков: три для адресных операций, три для целочисленных вычислений, и три для выполнения команд x87.

Архитектура кэш-памяти: AMD Athlon™ имеет наибольший для платформ x86 кэш L1 (128KB) - в четыре раза превосходящий L1 кэш процессора Pentium III (32KB). AMD Athlon™ также включает высокоскоростной, 64-битный контроллер кэш памяти второго уровня (L2), поддерживающий объем кэш-памяти второго уровня от 512Kб до 8Mб.

Сводная таблица по объемам, принципам организации и тактовым частотам кэш-памяти у процессоров от Intel и AMD:

Сравнение некоторых новинок от Intel и AMD:

По утилитам у Pentium 4 Extreme Edition четко видна кэш-память третьего уровня объемом 2 Мбайт, хотя на месте и все прежние атрибуты Northwood.

Аналогичная информация показана для Athlon 64. Интересно, что у нового Pentium 4 меньший степпинг, нежели у последних Northwood, — 5 против 9. По графику теста латентности памяти для Pentium 4 Extreme Edition можно заключить, что граница кэш-памяти L3 лежит на 2 Мбайт, L2 — на 512 кбайт.

Итак, для двух новых процессоров Intel и AMD характерна прежде всего огромная кэш-память, которая в конце концов, и должна поднять производительность каждого из них.

Сравним процессоры:

-AMD Athlon 64 FX-51 (тактовая частота 2200 МГц).

-AMD Athlon XP 3200+ (частота 2200 МГц, FSB 400 МГц).

-Pentium 4 (Northwood) с частотой 3,2 ГГц (FSB 800 МГц).

Pentium 4 Extreme Edition c частотой 3,2 ГГц (FSB 800 МГц).

В данном случае абсолютное сравнение частот процессоров лишено смысла, поскольку их микроархитектуры существенно различаются (и даже преследуют разные цели): в Pentium 4 производительность должна обеспечиваться преимущественно высокой тактовой частотой (для этого и увеличили до двадцати стадий вычислительный конвейер), а в Athlon упор делается на другие особенности, порой в ущерб тактовой частоте.

Разные подходы в микроархитектуре не позволяют адекватно сравнивать процессоры на одинаковой тактовой частоте.

И пример тому — разный предел частот при одинаковых технологических нормах производства: для технологии 0,13 мкм массовым пределом ядра Pentium 4 является частота 3,2–3,4 ГГц, а в Athlon — 2,2–2,4 ГГц. Поэтому корректнее сравнивать процессоры по пределу их частоты для той или иной технологии производства — в данном случае 3,2 и 2,2 ГГц.

По полосе пропускания двухканальной памяти впереди, безусловно, процессор AMD.

Хотя Пентиумы отстают от него заметно меньше, чем Athlon XP 3200+ (все они используют двухканальную DDR400). Athlon 64 FX ближе всех подошел к теоретическому пределом 6,4 Гбайт/с — на 86%, Пентиумы показывают примерно три четверти в штатных режимах работы (в режимах ускорения чипсета/памяти эффективность возрастает до более чем 80%), а Athlon XP утилизирует менее половины (из-за узкой системной шины). По скорости чтения памяти Pentium 4 Extreme Edition почти не отличается от Northwood (небольшое падение можно связать с недостатками метода измерения — потоки немного «застревают» в большом кэше L3), а Athlon 64 FX и тут вне досягаемости. Зато по скорости записи в память Pentium 4 Extreme Edition на голову опережает всех, включая Athlon 64 FX. Видимо, благодаря именно хорошему и «большому» кэшированию. Зато по латентности памяти Athlon 64 FX показывает просто фантастические результаты — всего 56 нс. Интересно также, что строго синхронный чипсет NVIDIA nForce2 обеспечивает порой лучшую латентность, чем Intel 875P. Вместе с тем, у чипсетов Intel 875/865 может быть латентность в районе 66 нс — если они работают в специальных (нештатных) низколатентных режимах.

Зачем увеличивать кэш?

Первичная причина увеличения объема встроенного кэша может заключаться в том, что кэш-память в современных процессорах работает на той же скорости, что и сам процессор. Частота процессора в этом случае никак не меньше 3200 MГц. Больший объем кэша позволяет процессору держать большие части кода готовыми к выполнению. Такая архитектура процессоров сфокусирована на уменьшении задержек, связанных с простоем процессора в ожидании данных. Современные программы, в том числе игровые, используют большие части кода, который необходимо извлекать из системной памяти по первому требованию процессора. Уменьшение промежутков времени, уходящих на передачу данных от памяти к процессору, - это надежный метод увеличения производительности приложений, требующих интенсивного взаимодействия с памятью. Кэш L3 имеет немного более высокое время ожидания, чем L 1 и 2, это вполне естественно. Хоть он и медленнее, но все-таки он значительно более быстрый, чем обычная память. Не все приложения выигрывают от увеличения объема или скорости кэш-памяти. Это сильно зависит от природы приложения.

Если большой объем встроенного кэша - это хорошо, тогда что же удерживало Intel и AMD от этой стратегии ранее? Простым ответом является высокая себестоимость такого решения. Резервирование пространства для кэша очень дорого. Стандартный 3.2GHz Northwood содержит 55 миллионов транзисторов. Добавляя 2048 КБ кэша L3, Intel идет на увеличение количества транзисторов до 167 миллионов. Простой математический расчет покажет нам, что EE - один из самых дорогих процессоров.

Сайт AnandTech провел сравнительное тестирование двух систем, каждая из которых содержала два процессора – Intel Xeon 3,6 ГГц в одном случае и AMD Opteron 250 (2,4 ГГц) – в другом. Тестирование проводилось для приложений ColdFusion MX 6.1, PHP 4.3.9, и Microsoft.NET 1.1. Конфигурации выглядели следующим образом:

AMD

- Dual Opteron 250;

- 2 ГБ DDR PC3200 (Kingston KRX3200AK2);

- системная плата Tyan K8W;

- ОС Windows 2003 Server Web Edition (32 бит);

- 1 жесткий IDE 40 ГБ 7200 rpm, кэш 8 МБ

Intel

- Dual Xeon 3.6 ГГц;

- 2 ГБ DDR2;

- материнская плата Intel SE7520AF2;

- ОС Windows 2003 Server Web Edition (32 бит);

- 1 жесткий IDE 40 ГБ 7200 rpm, кэш 8 МБ

На приложениях ColdFusion и PHP, не оптимизированных под ту или иную архитектуру, чуть быстрее (2,5-3%) оказались Opteron’ы, зато тест с.NET продемонстрировал последовательную приверженность Microsoft платформе Intel, что позволило паре Xeon’ов вырваться вперед на 8%. Вывод вполне очевиден: используя ПО Microsoft для веб-приложений, есть смысл выбрать процессоры Intel, в других случаях несколько лучшим выбором будет AMD.

Самые свежие новости от ведущих производителей процессоров(октябрь 2004г):

Американская компания AMD официально представила новые 64-разрядные процессоры для настольных компьютеров Athlon 64 FX-55 и Athlon 64 4000+. Чипы изготавливаются по нормам 130-нанометровой технологии и оснащаются 1 Мб кэш-памяти второго уровня. Как отмечается в пресс-релизе, кристаллы Athlon 64 FX-55 ориентированы на использование, прежде всего, в мощных мультимедийных системах, тогда как процессоры Athlon 64 4000+ позиционируются в качестве базы для создания решений бизнес-класса.

Процессор Athlon 64 FX-55 работает на тактовой частоте 2,6 ГГц, тактовая частота чипов Athlon 64 4000+ составляет 2,4 ГГц.

Чипы Athlon 64 FX-55 и Athlon 64 4000+ позволяют работать как со стандартными 32-разрядными приложениями, так и с 64-битными программами. Кристаллы поддерживают технологию Cool’n’Quiet, предназначенную для снижения уровня шума при работе компьютера, а также антивирусную защиту EVP (Enhanced Virus Protection) для работы которой потребуется операционная система Microsoft Windows XP Service Pack 2 или Windows XP Media Center Edition 2005.

О намерении выпускать компьютеры на базе представленных процессоров объявили такие известные производители как Alienware, Voodoo, Hypersonic PC Systems, Shuttle, Systemax, Totally Awesome, Velocity Micro, Vicious PC, Falcon Northwest и некоторые другие. Поставки процессоров уже начались.

Стали известны очередные подробности о планах Intel. Так, прояснилась ситуация с выходом двухъядерных процессоров Smithfield, которые будут объединять в себе два 0,09 мкм ядра, каждое из которых будет иметь 1 Мб кэша второго уровня. Таким образом, общая кэш-память будет составлять 2 Мб. Процессоры будут иметь поддержку не только антивирусной технологии Intel EDB (Execute Disable Bit, бит защиты от выполнения), но 64-битные расширения EM64T. Их выход планируется на третий квартал 2005 года.

Модельный ряд процессоров Smithfield будет представлен тремя моделями:

x20 – частота 2,8 ГГц, 2 Мб кэша, шина 800МГц, LGA 775, поддержка XD и EM64T;

x30 – частота 3,0 ГГц, 2 Мб кэша, шина 800МГц, LGA 775, поддержка XD и EM64T и Enhanced SpeedStep;

x40 – частота 3,2 ГГц, 2 Мб кэша, шина 800МГц, LGA 775, поддержка XD и EM64T и Enhanced SpeedStep;

Примечательно, что только старшие модели будут иметь поддержку технологии Enhanced SpeedStep, позволяющие динамически менять частоту процессора в зависимости от выполняемой задачи.

Также немного прояснилась ситуация с выходом процессоров Intel Pentium 6XX. Да, они появятся в первом квартале следующего года, но массовых поставок следует ожидать не ранее второй четверти 2005 г. Процессоры будут иметь 2Мб кэша второго уровня и шину 800МГц.

Каждое ядро двуядерных процессоров AMD Opteron и Intel Montecito, которые должны появиться на рынке в 2005 году, будет иметь свою собственную кэш-память. Это следует из заявления Камерона Макнэйри, исследователя корпорации Intel, и Мариуса Эверса, сотрудника AMD.

Использование нескольких ядер в одном процессоре позволяет повысить вычислительную мощность чипа при одновременном ограничении потребляемой им энергии. Ранее предполагалось, что кристаллы Intel Itanium нового поколения (кодовое название Montecito) получат 24 Мб общей кэш-памяти. Теоретически, наличие единого кэша увеличивает объем данных, к которым может обращаться процессорное ядро. Однако разделение кэшей существенно упрощает работу по проектированию кристаллов и, соответственно, сокращает время, необходимое для вывода конечных продуктов на рынок.

Вероятнее всего, каждое ядро Montecito будет оснащено 1 Мб кэша второго уровня и 12 Мб кэша третьего уровня. Впоследствии эти кэши могут быть объединены. Аналогично намерена поступить и компания AMD.

Следует заметить, что раздельные кэши для различных ядер использует и компания Sun в своих чипах UltraSparc IV.

Выводы.

Анализ изложенного выше материала позволяет сделать заключение, что в соответствии с каноническими теориями, современные производители Intel и AMD широко используют кэш-память при построении своих новейших процессоров. Во многом, их превосходные характеристики по быстродействию достигаются именно благодаря применению кэш-памяти второго и даже третьего уровня. Этот факт подтверждает теоретические выкладки Гарвардского университета о том, что ввиду действия принципа локальности информации в современных компьютерах применение кэш-памяти смешанного типа позволяет добиться превосходных результатов в производительности процессоров и снижает частоту необходимых обращений к основной памяти.

Налицо широкие перспективы дальнейшего применения кэш-памяти в машинах нового поколения, однако существующая проблематика невозможности бесконечного увеличения кэша, а также высокая себестоимость изготовления кэша на одном кристалле с процессором, ставит перед конструкторами вопросы о некоем качественном, а не количественном видоизменении или скачке в принципах, либо огранизации кэш-памяти в процессорах будущего.

К сожалению, никакой справочной или рекламной информации об использовании дисковой кэш-памяти от Intel и AMD обнаружить не удалось, поэтому данному подразделу в работе не уделено достаточного внимания.

Поделиться:





Воспользуйтесь поиском по сайту:



©2015 - 2024 megalektsii.ru Все авторские права принадлежат авторам лекционных материалов. Обратная связь с нами...