Главная | Обратная связь | Поможем написать вашу работу!
МегаЛекции

Кристаллы и то, что сверху

Код Число ядер Объём кэша L3, МБ Версия ГП Размеры и площадь кристалла, мм(²)
HE-4     HD4000 19,631×8,141=159,8
HM-4   HD2500 17,349×7,656=132,8
H-2     HD4000 14,505×8,141=118,1
M-2   HD2500 12,223×7,656=93,6

Пока известно о 4 видах кристаллов, но по аналогии с SB можно предположить, что сюда ещё должны войти как минимум две серверные версии (E и EP) без ГП, с 4-канальным ИКП и 40-полосным контроллером PCIe: 4 ядра + 10 МБ L3 и 8/10 ядер + 20/25 МБ. Более того, судя по последним сообщениям, 22-нанометровый техпроцесс позволит выпустить даже 12-ядерные версии с 30 МБ L3. Имеющиеся сегодня кристаллы упаковываются в корпуса LGA-1155 (для одноимённого настольного разъёма), rPGA-988B (для мобильного Socket G2), BGA-1023 и BGA-1224 (эти два — для непосредственной пайки к плате) — все они знакомы по SB, так что с тыльной стороны корпуса выглядят как обычно.

Относительные размеры переменной части кристаллов. Ниже находится ИКП, а правее — остальные блоки внеядра.

Интересно, что показанные в таблице цифры для кристалла HE-4 соответствуют степпингу E1, который выпущен на продажу. А вот ранее показанные публике чипы имеют предыдущую версию (видимо, E0). Эта же версия попала исследователям из фирмы UBM TechInsights, которые оценили площадь в 170 мм² и установили, что дополнительные 1,5–2 мм длины угадываются в районе трактов ГП. Такого удлинения как раз хватило бы, чтобы увеличить их число с 16 до 24. Может быть, до последнего времени у Intel были такие проблемы с надёжностью работы этой части, что она решила заложить в ГП 50%-ный резерв? Или это тестировалась новая, 24-трактовая версия?

К сожалению, число транзисторов, с которым мы так любим забавляться, известно только для самой крупной версии HE-4 — 1420 МТр. Для похожей по параметрам старшей версии настольных SB ранее указывали 995 МТр, но потом показания изменились на 1160, аргументируя тем, что, дескать, в прошлый раз не посчитали некие сервисные структуры, необходимые для реализации логической схемы в кремнии. На этот раз, видимо, в 1420 МТр таковые вошли, потому хоть одно арифметическое действие мы сможем сделать: 1420−1160=260 МТр, из которых, допустим, половина добавлены новому ГП (в старом HD3000 было 114 МТр), что вполне линейно бы соответствовало полученному ускорению в его работе. Бо́льшая часть остального — добавки и доработки внеядра. А ядрам (в каждом из которых у SB было по 55 МТр) наверняка достались всякие мелочи.

Глядя на первые фотографии этой версии кристалла (а других мы пока не имеем), видно, что относительные размеры основных структур ядра не изменились, что не удивительно. Масштабирование матриц L3 тоже почти такое же, как и у логики — если, конечно, её специально не разрядили, ибо раскладка чипа на крупные блоки такова, что делать ядро у́же банка L3 смысла нет.


Всё привычно и знакомо по SB: в центре — 4 x86-ядра и их банки L3, внизу слева — пустое место, справа — ИКП, левый край занят ГП, правый — внеядром. В ГП хорошо видны 16 векторных трактов и 2 одинаковых блока управляющей логики (вверху и внизу) для каждой половины трактов, а по центру ещё один общий блок. Нижние четверти банков L3 имеют пустоты между левыми и правыми матрицами — в версии HM-4, где у банков эта четверть отсутствует, сюда вдвигается ИКП. В старшем 2-ядерном кристалле H-2 ИКП левой частью подлезает под ГП. А вот как H-2 обрезается до M-2, пока неясно — в ГП надо что-то дополнительно удалять, чтобы уместить по ширине ИКП.


Тот же чип, но не на уровне транзисторов и (может быть) первого слоя металла, как мы привыкли видеть, а почти со всеми слоями — кроме самого верхнего, на которой «накатываются» шарики-контакты, и, возможно, ещё нескольких.


А вот готовые кристаллы SB и IB (под одинаковым увеличением), полностью покрытые выводами, под которыми почти ничего не видно даже на крупных снимках. (С сайта EE Times) Кстати, нижний снимок как раз и демонстрирует удлинённый степпинг HE-4.


Однако даже на уровне транзисторов без правильной методики съёмки мало что видно. Фото (с сайта ElectroIQ) сделано компанией Chipworks в процессе «разборки» кристалла после растворения всех медных дорожек и межслойных изоляторов.


Сравнение размеров полноценных 4-ядерных кристаллов SB и IB в одинаковом масштабе. За счёт сильного усложнения ГП его площадь даже увеличилась, причём вместе с пустым местом левее ИКП (что неизбежно при такой раскладке).


А вот это изображение показали первым — ещё на форуме IDF’2011. При сравнении с поздними ясно, что никаких новых технических тонкостей отсюда не выловишь, ибо в Intel сидят такие же мастаки Фотошопа, что и в AMD. Мало того, что низ чипа заменён зеркальным отражением, так ещё и с ГП намухлевали.

Вскоре после выхода ЦП на свет оверклокеры выяснили, что разгоняемость новых ЦП, не смотря на многообещающую экономию нового техпроцесса, оказалась меньше, чем у SB. На это есть две причины: во-первых, меньшая площадь кристалла позволяет рассеивать пропорционально меньшее количество энергии, ибо удельная теплопроводность кремния на единицу сечения неизменна. Во-вторых (и это влияет куда больше площади), если учесть не только кристалл, то удельная теплопроводность в данном случае всё же изменилась, причём также в меньшую сторону, т. к. отвод тепла ограничивается не столько площадью кристалла, сколько качеством контакта со встроенным теплораспределителем (IHS, integrated heat spreader) — металлической крышкой, покрывающей кристаллы большинства современных ЦП. Её роль в том, чтобы верхняя её часть, которой касается радиатор, выделяла тепло максимально равномерно. Без неё оказалось бы, что с кристалла надо уводить ≈50 Вт/см², зато оставшаяся вокруг площадь не отводит почти ничего.

Чтобы распределитель работал эффективней, его контакт с кристаллом должен иметь максимальную теплопроводность, чтобы тепло как можно быстрее уводилось сквозь него. До сих пор Intel использовала безфлюсовую пайку металла с тыльной частью кристалла. (Флюс это добавка к металлу для удаления поверхностных окислов, мешающих пайке. Но он имеет худшие тепловые и электрические параметры, чем принимающий металл, поэтому требуется создать условия, либо не вызывающие поверхностное окисление металла даже при нагреве, либо удаляющие окислы до спекания — и тогда можно обойтись без флюса.)

Однако в IB пайка заменена термопастой, которую обыватели привыкли видеть между процессором и радиатором, но её теплопроводность хуже. В результате максимальная выдерживаемая кристаллом температура опустилась с 94 до 85 °C (если судить по показаниям термодатчика ЦП), выше которой начинается троттлинг (дросселирование) частоты. А при разгоне разница с SB достигает уже 20 °C при прочих равных. Более того, теплопроводность конкретно этой пасты хуже других её видов, так что перед разгоном теперь рекомендуется снять крышку, очистить от высохшей старой пасты (не повредив кристалл и не поцарапав крышку, что весьма непросто), нанести новую (качественную) и установить крышку на место.



SB (вверху) и IB со снятыми IHS. Вверху на крышке видны следы пайки, а внизу — термопаста. (Нижнее фото — с Overclockers.com)

Ранее такой же прокол случался с линейками Core 2 с E4xxx по E6xxx. Как и тогда, предполагаемая причина — экономия денег. Какая экономия получилась на самом деле, учитывая, что блогеры и обозреватели успели раздуть скандальчик, — вопрос спорный. Intelлишь подтвердила, что при разгоне температуры будут выше ожидаемых, но заверила, что при штатных частотах надёжность не пострадала.

Детали о транзисторах

Независимый анализ кристалла компанией ChipWorks показал, что в чипе по-прежнему 9 уровней межсоединений, а длина затвора равна 22 нм (для техпроцесса с такой же численно технормой длина должна быть 11 нм, но памятливые читатели наверняка вспомнят 3-ю частьнашего микроэлектронного обзора, где наглядно показывалось, что́ происходит с нанометрами на самом деле), а минимальное расстояние между затворами (например, в СОЗУ) — 90 нм. Для предыдущего, 32-нанометрового техпроцесса Intel эти параметры были 30 и 113 нм соответственно. Как видите, никакого линейного уменьшения нет, но мы это и раньше выяснили… Кстати, для ясного понимания нижеследующих изображений периодически сравнивайте их с нашим теоретическим описанием 22-нанометрового техпроцесса (по ссылке выше).


Кристалл в разрезе. Огромная «байда» в центре — последний, 9-й уровень металла, на который насажены шарики припоя для контакта с подложкой. Остальная площадь кристалла, не занятая шариками, покрыта защитным изолятором, который тут виден поверх металла. Огромная площадь сечения 9-го слоя относительно других обусловлена тем, что он используется как силовой и тепловой распределитель. А в самом низу виден слой транзисторов. (Тут и далее в этой главе — фото ChipWorks)


Это сечение параллельно затворам ряда транзисторов. Серыми стрелками обозначены затворы, а белыми — истоки и стоки. Выше виден первый уровень дорожек.


Тут видны первые 5 уровней дорожек и инвертор в виде пары многозатворных транзисторов типа FinFET (с каналами-плавниками): nМОП слева и pМОП справа. Стрелкой обозначен контакт к их затворам, а под ним — двойной ряд затворов. Над каждым транзистором виден общий для плавников контакт истока или стока (они одинаковы и зависят лишь от направления тока), а под ними — обычная пластина (а не дорогая типа SOI, как у AMD).


Затвор nМОП-транзистора огибает каналы, имеющие в сечении форму высокого треугольника с закруглённой вершиной (pМОП-каналы со стороны напоминают шахматного слона). Тонкая тёмная линия вдоль нижнего края затвора — высокопроницаемый (high-k) подзатворный изолятор. Сам затвор выстлан нитридом титана (TiN, толстый светлый слой), являющимся «рабочим металлом» для nМОП, как и в 32- и 45-нанометровом техпроцессах Intel. В pМОП эту функцию исполняет TiAlN. (Если читатель захочет вспомнить, зачем нужна и чем важна вся эта химия — всё описано тут.)


Раз уж нам так нравится считать транзисторы в чипах — почему бы не посчитать и атомы в них?:) Вот вершина канала nМОП-транзистора под максимальным увеличением. Точки — это ряды атомов кремния. Тут наглядно видно, что каналы в транзисторах (не только этого типа, а везде и давно) ориентированы в направлении <110> — т. е. вдоль одного из трёх направлений кубической решётки кремния, чтобы проходящие по каналу электроны пореже сталкивались с атомами (в чём суть электрического сопротивления).


Этот сечение массива pМОП-транзисторов с общим каналом (т. е. перпендикулярно видам на фотографиях выше). Тут есть 4 рабочих затвора и 2 ложных, работающих лишь как законцовки плавника. У этих 4 транзисторов наверняка есть и другие каналы, параллельные данному — ближе и/или дальше плоскости этого сечения. Интересно, что вершины затворов вытравлены и заполнены изолятором, а контакты к истокам и стокам — самосовмещённые, как у микросхем памяти.


Крупным планом показан один из транзисторов. Контакты (в которых хорошо виден выстилающий нитрид) опускаются до истоков и стоков, сформированных из кремния, легированного впрыснутым в него германием, чтобы растянуть шаг решётки в этой области. Это создаёт механическое сжатие вдоль канала, что полезно для мобильности дырок. У nМОП-транзисторов канал, наоборот, растягивается, увеличивая мобильность электронов. Таким образом, в плавниковых транзисторах тоже формируется напряжённый кремний, как и в предыдущих техпроцессах.


Сравнение затворов двух видов транзисторов. Металл-заполнитель был сменён со сплава титана и алюминия на вольфрам (тёмное «ядро» по центру). Его оказывается больше в nМОП-затворах, т. к. в pМОП ради экономии на числе операций с пластиной присутствуют оба рабочих металла, а вот из nМОП нитрид титана (в pМОП он — краевой слой с плавными переходами между оттенками серого) после покрытия вытравливается, а потом сверху во все транзисторы осаждается TiAlN (более светлый и зернистый).


Наглядный ракурс на транзисторы под углом. Вертикальные светлые полосы — затворы, в т. ч. общие для комплементарной пары транзисторов. Затворы пересекают (или утыкаются — если они ложные) тоненькие стеночки-каналы, у которых видны небольшие бугорки или колонки — это вспучивания SiGe в местах истоков и стоков. Причём нечто похожее наблюдается и у nМОП-транзисторов, но это остатки металла контактов. Вобщем, всё не совсем так, как на цветных диаграммах…

Итог

Каждый раз для последней главы первое, что приходит в голову автору — текст, напоминающий новогоднее обращение российского президента к народу: этот год был непростым, но успешным, а следующий будет ещё труднее, но и ещё успешней, а также про такие-то проценты роста надоев в Закрома Родины и ВВП на душу населения… Говоря о новых процессорах, получается примерно так: прошлая архитектура была сложной и во многом новаторской, а нынешняя стала ещё сложнее и ещё передовее, получив такие-то проценты роста производительности и экономности (которые большинство читателей и так выяснили из ранее вышедших тестов)… Вместо банальностей лучше напишем о том, чего не надо делать, когда вы только что выпустили отличный процессор: про него не надо врать. А Intel тут почему-то прокололась.

9 января 2012 г. на выставке CES один из высоких руководителей в Intel Мули Идэн представлял Ivy Bridge и системы на их основе. По ходу презентации он показал то, что в его речи представлялось гоночной игрой Formula 1 с графикой DX 11, гоняемой на новом «ультрабуке». Но все местные Внимательные Зрители заметили интерфейс программы VLC, которая просто проигрывала ролик вместо реальной игры (точнее, пыталась, ибо даже воспроизведение клипа получилось рваным). Фото и ссылки на видео есть тут, где предлагается и очевидное объяснение: качество графики (и, особенно, драйверов) у ГП Intel всё ещё такое паршивое, что доверить им современную игру в реальном времени на презентации всё ещё нельзя — не смотря на все заявления о возможности такой игры.

В 2006 г. появился первый чипсет Intel со встроенным 3D-движком — G965. Драйверы не работали уже тогда, и каждый раз перед выходом нового поколения ГП компания обещала, что вот теперь-то всё заработает. Шли годы… Драйверы для графики SB до кондиции так и не довели — обещанные ещё в 2010 г. возможности аппаратного ускорения DX11 так и не выполнены, а OpenCL по-прежнему исполняется лишь x86-ядрами. (Кстати, упоминание поддержки DX 10.1 было удалено из поздних версий рекламных материалов для платформы Cedar Trail для новых ЦП Atom, когда публика обнаружила, что даже ей там не пахнет…) И вот теперь недоиспользованным возможностям HD3000 пришли на смену недопоказанные возможности HD4000.

Что обычно происходит, когда заявленное и обещанное не выполняется? «Скажем, что это лишь предпродажные образцы, тут возможны небольшие глюки»… «Перелопатим миллион чипов и отберём те два, которые полностью заработают — их и покажем»… «Вручную оптимизируем код “демок”, чтобы вытянуть всё что можно из этих ЦП, даже если в реальных программах такой оптимизации почти не будет»… Это и тому подобное вполне часто используется на презентациях. А вот чего обычно не делают, так это не подменяют живую картинку роликом и уж тем более не обманывают об источнике этой картинки даже после разоблачения. Мули, разумеется, сразу понял, что для зрителей уже «всё пропало», но отшутился, заявив, что игра «запущена из-за кулис», что тоже неправда.

Мораль тут проста — если что-то не совсем получается, то про эту часть лучше вообще не говорить, чем бросать пыль в глаза. Тем более, коли есть масса деталей, которые полностью готовы и отлично работают. Иначе получится, что кому-то из Внимательных Читателей или Зрителей придёт в голову крамольная идея о том, что не только игра «запущена из-за кулис», но и всякие прочие заявленные возможности являются не более чем блестящими фантиками. Даже если, как в случае с Ivy Bridge, это совсем не так.

 

Поделиться:





Воспользуйтесь поиском по сайту:



©2015 - 2024 megalektsii.ru Все авторские права принадлежат авторам лекционных материалов. Обратная связь с нами...