8 лет назад 9 сентября 2011 в 21:36 1168

Специально для тех, кто в танке: компания AMD буквально только что презентовала новое поколение десктопных процессоров и материнских плат. Как, вас это совсем не удивило? Странно. Вероятно, вы очень осведомленный человек. В сем остальным, чтобы осознать всю значимость и одновременно предопределенность этого события, стоит поворошить прошлое Advanced Micro Devices и вспомнить, как развивались события. А я помогу.

Процы AMD семейства Athlon ведут свою историю с 1999 года: тогда начался выпуск x86-процессоров K7 с ядрами Pluto, Orion (которые мало кто помнит, да и вставлялись они в античный разъем Slot A), а в 2000 году, уже с переходом на значительно более популярный впоследствии Socket A (462), появились известные ядра Thunderbird. Плеяда замечательных Athlon и Athlon XP: Duron, Palomino, Thoroughbred, Barton, Thorton, которые и наш журнал восторженно описывал в те далекие годы, это все продукты развития микроархитектуры К7. Греет душу и тот факт, что первыми частоту 1 ГГц преодолели именно топовые «Атлоны», – тот рекордсмен, 1116-мегагерцевый Athlon стоил $1300 в оптовых партиях.

Не останавливаясь на достигнутом, следующий правильный шаг AMD сделала в 2003 году. Компания начала выпуск серверных процессоров Opteron с другим внутренним устройством, которое получило имя К8. Помимо вполне понятной «работы над ошибками», которые имелись в процах K7, революционных нововведений появилось ну очень много. Самое главное – интегрированная в CPU часть северного моста, контроллер подсистемы памяти. Впервые для того, чтобы загнать данные из CPU в ОЗУ и переместить накопленное обратно, больше не нужно было перемещать их по шинам матплаты.

Работа инженеров AMD напомнила мне изыскания алхимиков в Средние века. Смешивая известные вещества, они искали «философский камень».

В контексте сегодняшней статьи это очень важный факт. Запомните: первые удачные реализации идеи размещения компонентов на едином кристалле начались с подачи именно AMD еще восемь лет назад. Фактически AMD поставила на выигрыш за счет выполнения как можно большего количества инструкций за такт (в К8 – три) и короткого вычислительного конвейера процев K8, что позволило получить паритет с CPU главного конкурента при меньших тактовых частотах. Давайте взглянем, что предлагала нам Intel в 2003 году (в «верхнем» десктопном сегменте). Это был расцвет микроархитектуры P68 (NetBurst), или, если совсем упрощенно, «четвертого пня» с кодовыми названиями ядер Willamette и Northwood. Для сравнения: ядро K8 проводило вычисления в 12 стадий, NetBurst – в 20, а появившийся в 2004 году знаменитый «отопительный прибор» Prescott и вовсе имел 31-шаговый конвейер.

И именно разница в подходах к решению одной и той же задачи значительно повлияла (и продолжает влиять!) на ход событий. Если вы помните, для дальнейшего ускорения процессоров Intel встала на путь экстенсивного увеличения частот и, спустя годы, количества ядер, а аэмдэшные процы в силу технологических причин изначально не позволяли сильно задирать такт. Prescott в процессе эволюции достиг 3,8 ГГц, AMD Athlon 64 довольствовались частотами 2,0-2,8 ГГц. И если отметка в 2 ГГц была пройдена обоими процессорными гигантами без помпы (во всех смыслах этого слова (хитрый смайл) и относительно без затруднений, то 3 ГГц, не считая оверклокеров, первыми увидели приверженцы платформ Intel.

По прошествии лет на основе К8 было сделано огромное количество процессоров семейства Athlon, одно- и двухъядерных, и это было очень славное время для компании. AMD вновь напомнила о себе осенью 2007 года: новый 65-нанометровый техпроцесс, новый «серверный» Opteron на ядре Barselona, новая микроархитектура K10 Stars – и новое имя Phenom в перспективе для всех. Причем, как всегда, за недорого. В ожидании релизов казалось, что AMD закрепит былые успехи и чем-нибудь удивит. И ведь правда, удивлению не было предела: впервые за много лет AMD явно начала «буксовать». Появившиеся буквально из ниоткуда в 2006 году, процессоры Intel Core 2 Duo оказались очень сильным противником.

Сделанные на основе 45-нанометрового техпроцесса, они функционировали на очень высокой частоте (в разгоне – до 4 ГГц «на воздухе» и больше 6 ГГц под более серьезным «холодильником»), а били они всех благодаря весьма эффективному короткому конвейеру, емкому и быстрому L2-кэшу, общему для всех ядер, и 65-ваттному TDP. Примечательно, что для такого технологического прорыва интеловцам пришлось забыть многие прошлые наработки по NetBurst и вернуться к позапрошлым, взяв за основу Pentium M и Pentium II, фактически придумав новый суперкамень с нуля.

AMD, переходя с К8 на К10, была настроена не столь радикально. Но инженерам и программистам все равно пришлось проделать очень серьезную работу: усовершенствовать механизм предсказания переходов, ввести новые инструкции, модернизировать блок, ответственный за вычисления с плавающей точкой, а помимо увеличения пропускной способности личного для каждого из ядер кэша второго уровня ввести общий L3-кэш. Был улучшен и встроенный контроллер памяти: теперь он поддерживал память DDR2. Некоторые недостатки мудреной системы кэширования можно было бы легко скомпенсировать мегагерцами, но их как раз очень не хватало: все, включая разгонные возможности, упиралось и в тепловыделение, читай – в микроархитектуру, и в 65-нанометровый техпроцесс.

Новейшие четырехъядерные AMD Phenom X4 и их «обрезки» с тремя ядрами, а также «Атлоны» и «Семпроны», едва вызвав интерес у знающих людей, начали интенсивно терять очки. Ситуация немного улучшилась с появлением в 2009 году процессоров Phenom II с ядрами Deneb, Heka и Callisto – благодаря 45-нанометровому техпроцессу частоты перешагнули наконец через порог 3 ГГц и достигли 3,6 ГГц. И все бы ничего, но Intel им противопоставила мощные «квадкоры» и «гексакоры» Core i5 и i7 микроархитектуры Nehalem, и основное преимущество AMD на этом этапе эволюции виделось лишь в неприлично низкой цене камней. Да и не ровня Stars и Nehalem: 32-нанометровый Core i3 с двумя ядрами может нахально потягаться с AMD Phenom II X4 и в некоторых дисциплинах уйти вперед с приличным отрывом.

Сейчас на K10.5 – это последняя версия микроархитектуры Stars – основаны актуальные шестиядерники AMD с ядрами Thuban и их четырехъядерными братьями Zosma и Deneb. Они при низкой стоимости имеют высокую производительность, но и их век подходит к своему концу.

2011 год. Новый удар и новые повороты
Из всего вышенаписанного становится очевидно, кто из двух соперников с каким арсеналом пришел в лето 2011 года. Как разворачивались события в 2011 году, знают, наверное, даже те, кто компьютерами особо не увлекается: Intel на Новый год «выкатила» CPU семейства Sandy Bridge – отличный подарок любителям апгрейда. Причем с «аксессуарами» в комплекте – новым набором логики и новым сокетом. Поспешное освоение тонкого техпроцесса при проектировании чипсета привело к фатальной аппаратной ошибке, из-за чего продуманная до мелочей схема экспансии новых процев дала сбой, но на общий ход событий это почти не повлияло.

Итак, сейчас у Intel – три действующих процессорных разъема: LGA 1155, LGA 1366 и в какой-то степени LGA 1156. Несколько новых чипсетов P67, H67, Z68, «корпоративные» наборы логики B65, Q65, не считая «старых» (образца 2009 / 2010 годов) X58 и P55, а также прошлые комплекты – H55, H57, Q57. И не меньшее изобилие процессоров под все перечисленное, на любой вкус и кошелек. У AMD – Socket AM3, некоторое количество топовых процев с шестью ядрами, а также всех прочих с четырьмя и двумя, бюджетный Sempron до кучи и целые две линейки чипсетов AMD серий 7хх и 8хх. Разница есть, не правда ли? Не велите казнить: я сознательно умолчал об AMD Brazos. Во-первых, это совсем даже не CPU, а APU, во-вторых, это все же не десктопный сегмент, хотя за «неимением горничных» материнские платы на его основе встречаются и в настольных мини-ПК.

Расскажем о терминах, или «речки-кошечки-собачки»
В последнее время наблюдается явная запутанность, которую внесла AMD, именуя кодовыми словами свои новые продукты и технологии. Вот AMD Llano, который сегодня «виновник торжества» и до которого мы никак не доберемся, это что? Это – название процессора с видеоядром, собственно камня. По аналогии AMD Zacate или серия E – тоже APU с интегрированной графикой, но «играющий» в мобильном сегменте.

AMD Llano имеет микроархитектуру с названием Husky («собачка-лайка»?), а AMD Zacate – Bobcat («красная рысь»). Когда AMD выпускает тот или иной новый процессор, она заранее готовит для него платформу: в случае с AMD Zacate это Brazos (запомнить можно – это речка в США, берега которой воспеты в тюремных песнях), для AMD Llano уготована Lynx – просто «рысь». Есть и третий вариант компоновки, мобильная платформа Sabine (женское имя), которая нацелена на лэптопный сектор, но, в отличие от Brazos, ориентирована на более мощный, чем AMD Zacate, процессор Llano, однако сегодня она в рамки материала никак не вписывается. Весь конструктор относится к концепции Fusion, разработке, которая берет начало с момента слияния AMD и ATI.

Итак, Lynx – это композиция из APU Llano и материнской платы, в основе которой лежит FCH – Fusion Controller Hub. Как мы не раз говорили и еще скажем, после переезда всех компонентов северного моста под теплораспределительную крышку FCH стал неким дистрибуторским центром, который под управлением APU командует всей периферией, начиная с USB-портов и заканчивая выходами HD Audio и каким-нибудь кардридером, который, кстати, не шутка, а теперь вполне самостоятельная функция «чипсета». В Lynx на сегодняшний день входят два варианта платформ – A75 FCH и A55 FCH. Отличий в них немного: A75 – старшая модель, нативно поддерживает четыре порта USB 3.0 и имеет хитрый дисковый контроллер, позволяющий к одному SATA-порту подключать несколько накопителей по технологии FIS Based Switching.

Llano: cтавки на Fusion сделаны
Что увидит IT-журналист или простой пользователь, которому в руки попадет новый AMD Llano? Правильно, процессор. То есть все тот же квадрат из композита с металлической крышкой сверху и множеством позолоченных ножек на брюшке. Конструкция процессорного разъема, если сравнивать Socket FM1 для Llano и Socket AM3 для Athlon / Phenom, принципиально не изменилась: это все тот же PGA-ZIF-разъем («с лапкой»), но количество контактов в нем теперь 905 против 941 у Socket AM3. Та тщательно выстроенная цепочка AM2 – AM2+ – AM3, (которой не раз попрекали Intel, меняющую сокеты чуть ли не раз в год) нарушилась, и уже точно можно говорить об отсутствии совместимости AM3 и FM1, и прямой, и обратной.

При этом Socket AM3+ (который, скорее всего, станет переходным) будет еще какое-то время поддерживать на плаву старые процессоры, но и его достаточно быстро сменят. И еще, несмотря на решительный отказ от старых разъемов, совместимость креплений кулера сохранилась, и старый охладитель для AM2 / AM3, который вам так дорог, отлично поработает и на FM1. Внешне, если не вчитываться в маркировки, отличий с камнями Socket AM3 нет. Гораздо интереснее становится, если снять теплораспределитель и посмотреть на начинку, желательно под сильным микроскопом.

В структуре процессора (если брать старшую модель A8) отчетливо видны следующие блоки: четыре вычислительных ядра с личным 1 Мбайт L2-кэша для каждого, двухканальный контроллер памяти DDR3 с приткнувшимися к нему северным мостом и модулем UVD-декодирования, а также контроллер 24 линий PCI Express 2.0 в выделенной зоне интерфейсного блока внизу. 16 линий предназначаются видеокарте, причем в зависимости от количества видюх они могут использоваться по схемам 1 х 16 или 2 х 8, то есть поддержка CrossFire X реализована на уровне APU. Еще четыре уходят на периферию, для общения CPU и FCH по UMI-шине, производительность которой не хуже, чем у аналога от Intel.

Все перечисленное – только «левая половина» ядра, примерно столько же места занимает GPU. Вы только представьте: на графический контроллер и его «обвязку» отведено столько же площади чипа, сколько и на четыре вычислительных ядра с кэшем, – да, это заставляет задуматься. Ну а теперь по порядку. Техпроцесс нового чипа – 32 нм. Ныне это не самая мелкая микросхема – Intel сейчас откатывает нормы 22 нм, которым, согласно ожиданиям, будут соответствовать будущие процы Ivy Bridge, которые должны выйти к концу этого года. В AMD прекрасно осознают технологическое отставание и (вспомните 2003 год!) уповают на обновленную микроархитектуру, увеличение количества инструкций за такт, улучшение сообщения по шинам между компонентами процессора (29,8 Гбайт/с по связке «видеоядро-системная память»). Но главная ставка делается на встроенный GPU.

Вычислительные ядра – вы не поверите – все те же Stars. Когда я впервые услышал это, я минуту не мог говорить. Новый процессор, весь из себя новаторский, «растет» из 2007 года! Но помимо перехода с 45-нанометрового техпроцесса на нормы 32 нм его порядком усовершенствовали. Так, заметна реорганизация контроллера памяти: теперь официально поддерживаются модули до 64 Гбайт с тактовой частотой до 1866 МГц. Доработан аппаратный блок предсказания ветвлений, увеличен кэш L2, а L3 отрезан совсем.

 

Кроме того, в камне применена технология Turbo Core второго поколения, динамически изменяющая частоту каждого из ядер в зависимости от нагрузки. Датчики тока, встроенные в кристалл, цифровые, что увеличивает точность регулирования. Вообще же, реализации технологий энергосбережения отведено немало внимания, поскольку несколько горячих кристаллов под одной крышкой – это не шутка, а повторения истории Prescott не хочет никто. Старшие десктопные модели «втиснуты» в 100-ваттные нормы TDP (динамический разгон Turbo Core в них отключен), младшие довольствуются 65-ваттным пакетом и могут ускоряться на несколько сотен мегагерц.

Главный козырь
Если окинуть взглядом все новшества в Sandy Bridge и так же пристально взглянуть на APU Llano, сразу станет видно, что Intel основные ставки сделала на вычислительную часть и выполнила ее просто блестяще. Настолько, что AMD пока даже не приблизилась к чему-то подобному. Чтобы сократить отставание, нужно было найти слабое место, ахиллесову пяту конкурента. Не считая слаборазвитой периферии у интеловских платформ (вспомните, для примера, про порты USB 3.0, которые в LGA 1155-платформах подключены через дискретные контроллеры матплаты, или целых два «чипсетных» порта SATA 6 Gb/s там же и сравните с функциями A75 FCH), таким местом стала графика. И основной «удар» AMD стратегически верно решила нанести в эту область.
Графическое ядро AMD Llano A8 – гордость инженеров компании.

 

Название его красноречиво, Sumo, а в основе лежит кристалл Redwood. Это доработанная пятитысячная линейка Radeon, а именно Radeon HD 5600 – самое мощное интегрированное решение сегодняшнего дня. Посудите сами: 400 потоковых процессоров, функционирующих на частоте 600 МГц с полной аппаратной поддержкой DirectX 11, DirectCompute и OpenCL, также имеются: двойная 2 х 64-битная шина с возможностью отправки данных непосредственно в память, 5 блоков SIMD, 20 текстурных процессоров, 8 блоков ROP, «пятые шейдеры» (Shader Model 5.0). Нативно поддерживаются 24х-мультисэмплинг и 16х-анизотропия. Плюс есть возможность объединения усилий по обработке графики с дискретной видеокартой – режим Dual Grafics. Блок видеодекодера UVD, упоминаемый выше, понимает все распространенные форматы файлов. К тому же все модули, входящие в графическую подсистему, динамически отключаемы, что экономит энергию и снижает температуру кристалла.

 

Узкие места
Если внимательно изучать структуру нового процессора, узких мест даже невооруженным глазом и даже без подробного тестирования видится несколько. И первое из них напрямую касается графического блока. Беда в том, что разогнанная даже до 1866 МГц «десктопная» память DDR3 не так быстра, как GDDR5, которая применяется в видеокартах, а в контексте AMD Llano она используется не только для нужд GPU, но и для CPU.

Да, как я уже говорил, GPU имеет приоритет, но при высокой нагрузке и он не поможет, и снижение скорости графических вычислений – вполне реальная угроза. Но в AMD предусмотрели и такой вариант развития событий – в будущих реализациях платформы Lynx должен появиться чип или чипы быстрого банка Side Memory. Второе «бутылочное горлышко» – инфраструктура и коммуникации модулей. Intel уделила максимум внимания этому аспекту, применив в процессорах Sandy Bridge кольцевую шину, по которой все компоненты могут обмениваться данными между собой. AMD такой разработки не имела, зато задействовала Fusion Compute Link. Это первая реализация технологии связи GPU и северного моста, минуя линии PCI Express.

Третье узкое место – подсистема памяти. С учетом нагрузки со стороны CPU и GPU даже 1866 МГц – это мало. Intel со своими 1333 МГц (но 2133 МГц в разгоне!) выглядит хуже.
Четвертое – снова малая тактовая частота вычислительного блока. Поскольку мы видим очередную инкарнацию K10, этот недостаток опять дает о себе знать. Даже «верхний» камень A8-3850 работает на 2,9 ГГц (по вычислительным ядрам), младший же довольствуется 2,1 ГГц. Ну а топовый четырехъядерный AMD Llano соответствует по частоте младшему четырехъядерному Intel Core i5. Дорогу оверклокерам!

Только не спешите делать выводы
Новые процессоры AMD стоит рассматривать не как попытку «свалить» Intel, а как пробный шар, который AMD пустила на дорожку, чтобы «пристреляться» и сбить нескольких стратегических кеглей. Целей несколько. Первая – напомнить о себе, встряхнуть покупателей, застолбить участок – называйте как угодно. Ведь за чередой релизов процессоров и чипсетов Intel Sandy Bridge про AMD как-то подзабыли, несмотря на удачный старт платформы Brazos в ноутбуках.

Вторая – начать практическую реализацию мощных десктопных решений проекта Fusion, и с этой точки зрения AMD Llano – просто концепт, в котором, как в конструкторе, могут быть заменены основные составные части – вычислительные и графические ядра – и, соответственно положение и цена готовых изделий на рынке. Не исключено, что запуск данных процев вызовет переход некоторых пользователей с платформы AM3 на платформу FM1, а также даст временную отсрочку на случай задержки выпуска Bulldozer, который, по всем имеющимся сведениям, будет технологически совершеннее. Ни в коем случае нельзя воспринимать Socket FM1 и камни Llano A8 как законченное топовое решение. Скорее всего, это основа недорогого мультимедийного ПК для рядового пользователя «на каждый день». С мощной графикой, экономичного и функционального. UP

Будущая аудитория и оверклокеры
Многие потенциальные покупатели очень расстроились, узнав, что AMD Llano не будет поддерживаться со стороны «старых» материнских плат. С этой точки зрения ситуация не выглядит радужной, поскольку владельцы AM3-процессоров вряд ли побегут наперегонки за новым CPU, который по вычислительной мощности заведомо слабее их «Фенома». Зато возрадовались оверклокеры, которые, увидев волшебные слова «новый 32-нанометровый техпроцесс», принялись радостно потирать ладони.

Спешу немного охладить пыл поклонников «поджарки камней»: в AMD Llano не только применен тонкий техпроцесс, но и значительно усложнена внутренняя структура камня, что на разгоне сказывается крайне негативно. Нельзя забывать и о том, что CPU более поздних степпингов разгону поддаются намного лучше – сказывается последовательная оптимизация внутренней структуры.

Но о том, как разгоняется AMD Llano, уже есть первые сведения. Итоговая частота процессора по привычной схеме складывается из частоты базовой шины (100 МГц) и множителя. Понятно, что так жестко блокировать оверклокинг, как Intel, AMD не стала – фанаты просто не поймут. На радость всем, шина поднимается точно, множитель – нет. Но есть непроверенная информация о том, что скриншоты CPU-Z с 3,8 МГц на ядре – фейк, поскольку из-за ошибки первых BIOS выставленный выше 29x множитель просто игнорируется, но фиксируется оптимистичными программами мониторинга. При этом видимого увеличения производительности нет. Тестовые лаборатории уже предупреждены о странном явлении, а проверить, так ли это, лично я смогу уже на следующей неделе.

Никто не прокомментировал материал. Есть мысли?

Смотрю на таблицу номер 1 и не могу понять, толи там ошибка в строках TDP и GPU, толи мне обратно в школу пора =)