14 лет назад 15 января 2010 в 15:42 1093

Впрочем, если учесть, что «настольные» ЦП AMD, находящиеся на самой вершине статусной лестницы ее модельного ряда, продаются по оптовой цене менее $250, такое решение совсем не выглядит странным – ведь приобрести «старшие» модификации Phenom II может себе позволить намного большее число людей, нежели какой-нибудь Core i7. Кроме того, флагманские процессоры AMD недавнего прошлого выглядели слишком уж бледно на фоне конкурирующих творений Intel, поэтому и о спасении своего доброго имени первой тоже надо было думать.

Представив достаточное количество трех- и четырехъядерных модификаций Phenom II, AMD взялась и за расширение сферы влияния обновленной K10, внедрив ее и в девайсы нижних ценовых сегментов. И только после этого данная компания решила более плотно заняться насыщением «срединных областей», задействовав для этого Athlon II X4, об одном из которых мы сегодня и поговорим.

Начнем с того, что эти ЦП, как и прочие новые Athlon’ы, отличаются от своих «старших» братьев Phenom’ов тем, что у них отсутствует кэш третьего уровня. О том, «как именно он отсутствует», кстати, стоит рассказать поподробнее. Для процессоров Athlon II X4 AMD спроектировала отдельный кристалл под названием Propus площадью 169 мм2 (у Deneb – 258 мм2), на котором данного ЗУ нет вовсе. Но для производства данных камней используются также и ядра от Phenom II X4, на которых третьеуровневый кэш физически присутствует, но пребывает в заблокированном состоянии.

Уже известны и случаи его успешного включения – как и в ситуациях с запуском неактивных ядер на других процессорах, осуществить данную операцию можно только при помощи «живительной силы» функции Advanced Clock Calibration. Впрочем, проходит такой фокус далеко не со всеми матплатами и камнями – например, нашему тестовому стенду в этом плане, увы, похвастаться оказалось нечем. Информацию об остальных характеристиках нашего испытуемого, а также о его сопернике Phenom II X3 705e вы можете почерпнуть из соответствующей таблицы, а о тестовом стенде и методике тестирования – из близлежащей врезки.

Процессор Athlon II X4 620 проходил испытания не только в штатном режиме работы и при разгоне (о котором речь пойдет чуть позже), но и со сниженной до уровня Phenom II X3 705e частотой: ведь только сравнив таким образом эти два камня, можно узнать, что больше любят наши тестовые программы, четвертое ядро или кэш третьего уровня, и как сильно их предпочтения влияют на производительность. А пущую «чистоту» такому сопоставлению придает то, что настройки всех компонентов компьютера в этих двух случаях были идентичны, так как уменьшение частоты было достигнуто при помощи изменения процессорного множителя.

Тестовый стенд и методика тестирования
Наш тестовый стенд включает в себя следующие компоненты: материнкую плату ASRock M3A780GXH/128M, два модуля «мозгов» A-Data AD31600X001GU (DDR3-1600 (7-7-7-20)) по одному гигабайту, видеокарту MSI N275GTX Lightning, жесткий диск Samsung HD403LJ, кулер Ice Hammer IH-4300 B с неродным раскрученным до 3000 об/мин пропеллером (термопаста КПТ-8) и блок питания Hiper HPU-5B680 (680 Вт). Стоит сказать, что характеристики вышеупомянутого графического адаптера существенно отличаются от эталонных для GeForce GTX275 параметров – так, частоты ядра и памяти увеличены с 633 / 1134 (2268) до 700 / 1150 (2300) МГц соответственно, а объем ЗУ – с 896 до 1792 Мбайт.

AMD Athlon II X4 620
AMD Athlon II X4 620

В качестве операционной системы выступала 64-разрядная версия Windows Vista Ultimate SP2 с установленными драйверами ForceWare 190.62. Испытания проводились, как водится, и в синтетических, и в «реальных» приложениях – к числу первых относятся такие программы, как SuperPi 1.5 (1M), а также PCMark Vantage 1.00. Переходной ступенью между синтетическими и «натуральными» дисциплинами являются софтины x264 HD Benchmark 2.0 и Cinebench R10 – первая определяет скорость декодирования видеозаписей формата 720p при использовании кодека x264, вторая же позволяет оценить производительность системы при построении изображений (в нашем случае использовался многопоточный процессорный тест). Окончательное «столкновение с реальностью» наших подопытных ждет в следующих приложениях: Photoshop CS4 11.0.1, WinRAR 3.90, Call of Duty: World at War, «Анабиоз: сон разума» и Far Cry 2.

Теперь несколько замечаний касательно настроек и методик тестирования. При прохождении испытаний в «фотомастерской» участникам был предложен набор из пятнадцати заданий, описание которого можно найти (а заодно и скачать) по адресу: www.driverheaven.net/photoshop.php. В играх использовались следующие параметры: все настройки, кроме отключенных анизотропной фильтрации и сглаживания, ориентированы на максимальное качество, а разрешение установлено на уровень 1280 x 1024 пикс. Замеры производительности в Call of Duty: World at War проводились при помощи заранее записанного деморолика, а в Far Cry 2 – с использованием встроенного тестового модуля (карта Ranch Small). Для оценки быстродействия системы в «Анабиозе» применялась программа Cryostasis Tech Demo (www.nzone.com/object/nzone_cryostasis_downloads.html).

AMD Phenom II X3 705е
AMD Phenom II X3 705е

Пара слов о ПО x264 HD Benchmark: результаты, выдаваемые ею, разделены на четыре части, но мы для удобства восприятия в качестве итогового показателя будем приводить их среднее арифметическое значение – благо никакие особо ценные сведения при этом не потеряются.

В плане разгона новичок проявил себя с самой лучшей стороны – при использовании, прямо скажем, не самой продвинутой охлаждающей системы его частоту удалось поднять до уровня 3750 МГц (напряжение для этого пришлось увеличить на 0,1 В). Более того, большинство тестов он проходил при «герцовке» 3744 МГц, но, к сожалению, не все – поэтому для проведения основных испытаний частота процессора была снижена до 3549 МГц. Разумеется, разгон не мог не повлиять на некоторые другие компоненты системы: так, частоту оперативной памяти пришлось снизить до 1456 МГц (задержки изменению не подвергались), зато северный мост и шина HyperTransport функционировали при 2184 МГц вместо штатных 2 ГГц.

На этом, пожалуй, можно завершить подготовительную часть и перейти к главному – то есть описанию непосредственно соревновательного процесса между Athlon II X4 620 и Phenom II X3 705e. Итак, SuperPi: тест этот однопоточный, поэтому новичку здесь его четвертое ядро никоим образом помочь не могло. А вот для «семьсот пятого» наличие кэша третьего уровня оказалось очень хорошим подспорьем – соперник был повержен как в «ослабленном», так и в нормальном состояниях, причем перевес в обоих случаях оказывался весьма неплохим, но после «выхода на пик формы» Athlon II X4 620 сполна отомстил обидчику за прошлые поражения.

Теперь переходим к PCMark Vantage. В отличие от предыдущей тестовой программы, являющейся почти «чисто процессорной» (хотя, понятное дело, и к оперативной памяти она относится тоже привередливо), данное приложение усмиряет «эго» ЦП и выносит вердикт всей компьютерной системе в целом. Поэтому наблюдаемый здесь эффект от повышения тактовых частот и не столь ярко выражен, как в вышеописанных случаях. Впрочем, все результаты довольно четко различаются – заметен даже переход Athlon II X4 620 от 2,5- к 2,6-гигагерцевому режиму. В борьбе же «шестьсот двадцатого» с Phenomом первого выручает четвертое ядро.

Теперь же обратимся к описанию того, как наши герои справлялись с прикладными задачами. В трех соответствующих испытаниях (связанных с архивированием данных, декодированием видеозаписей, а также построением изображений в Cinebench) соревновательная картина аналогична той, что сложилась в случае с PCMark, то есть позади всех расположился Phenom II X3 705e (стоит разве что отметить, что на сей раз его отставание более существенно – особенно в x264 HD Benchmark и Cinebench), впереди него идут 2,5- и 2,6-гигагерцевые «ипостаси» Athlonа, а лидирует с солидным отрывом этот же процессор, разогнанный до частоты 3,55 ГГц.

А вот результаты, продемонстрированные испытуемыми в программном пакете Photoshop, лучше всего согласуются с тем, что мы наблюдали в случае с SuperPi: кэш третьего уровня помогает Phenom’у одержать верх над равночастотным Athlonом, но в сражении с разогнанной версией последнего наличие данного запоминающего устройства уже не спасает трехъядерник.

Приблизительно такая же картина имеет место и в двух более-менее «тяжелых» с графической точки зрения играх – «Анабиозе» и Far Cry 2, а вот в «легкой» Call of Duty даже 100-мегагерцевое преимущество позволяет Athlonу оторваться от Phenomа на 6 кдр/с. Что касается того, как процессоры выдерживали «пытки» программой S&M, то стоит отметить тот факт, что для охлаждения Athlon II X4 620, работающего на штатных частотах, вполне достаточно и не слишком продвинутой СО, так что
с данным испытанием оба камня справились нормально. Но все же на серьезный долговременный разгон, не имея хорошего кулера, нацеливаться не стоит.

Вердикт. Пожалуй, любой потенциальный покупатель компьютера на базе платформы Socket AM3 не отказался бы заполучить в качестве процессора какой-нибудь Phenom II X4. Но, понятное дело, в составе далеко не каждой такой машины имеются данные камни – некоторые из вышеупомянутой категории граждан считают, что столь мощный ЦП им просто не нужен из-за его избыточной «мускулистости», другие же и рады бы сделать выбор в его пользу, да вот финансы не позволяют. Так или иначе, в этом случае необходимо принять решение: какой же процессор взять вместо старшего Phenomа.

Компания AMD услужливо предлагает два варианта – отказаться от четвертого ядра и приобрести Phenom II X3 либо же обойтись без «рубки голов», но «отречься» при этом от кэша третьего уровня, купив Athlon II X4. Что и говорить, выбор непростой. И правильность его определяется исключительно «предпочтениями» тех программ, с которыми приобретаемому процессору предстоит иметь дело.

Конечно, прирост производительности от задействования кэша третьего уровня будет наблюдаться в очень большом числе приложений, тогда как с полезностью четвертого ядра ситуация принципиально иная: быстродействие оно повышает далеко не везде, зато в тех случаях, когда это происходит, скорость выполнения программ вырастает весьма существенно. Например, в использованных нами сегодня тестах в состязании равночастотных Phenomа и Athlonа первому ни разу не удалось обогнать соперника даже на 10%, тогда как второй в x264 HD Benchmark превзошел конкурента на 29%, а в Cinebench – на 21%. Стоит также отметить, что на ценовой шкале процессоры Athlon II X4 располагаются ниже, нежели Phenom II X3, – например, Athlon II X4 630 стоит на $23 дешевле аналогичного по частоте Phenom II X3 720 Black Edition.

Так что ответ на вопрос, какой же процессор лучше, целиком и полностью зависит от его предполагаемой сферы применения.

P.S. Вообще ценовые параметры новых камней заслуживают отдельного разговора – ведь на фоне прочих четырехъядерников свежие Athlonы в этом плане существенно выделяются. Так, оптовые цены на Phenom II X4 9xx начинаются с отметки в 175 вечнозеленых (по-прежнему в строю и 112-баксовый Phenom X4 9650 (2,3 ГГц), но кому он по большому счету сейчас нужен?), а самые дешевые из интеловской линейки Quadов – Core 2 Quad Q8200, Q8300 и Q8400 (с частотами 2,33, 2,50 и 2,66 ГГц соответственно) продаются за 163 американские денежные единицы.

О всяких же Core i5 и тем паче i7 и говорить не стоит. А вот наиболее доступный Athlon II X4 – протестированная нами сегодня «шестьсот двадцатая» модель – стоит всего-навсего 99 долларов. Так что непосредственными конкурентами Athlon II X4 оказываются двухъядерные процессоры, причем не самые продвинутые. Со стороны Intel в данном качестве выступают камни из семитысячной серии Core 2 Duo с частотами от 2,53 (E7200, 113 долларов) до 3,06 ГГц (E7600, 133 бакса). Из числа же продуктов AMD эту роль играет Phenom II X2 550 Black Edition (3,1 ГГц, $105).

Конечно, в большинстве программ «для простых смертных» превосходство вышеупомянутых «двуглавых» процессоров по тактовой частоте и объему кэша сделает свое дело и не позволит новым Athlon’ам превзойти их по производительности, но такое положение вещей не будет сохраняться вечно – процент программного обеспечения, оптимизированного под работу на компьютерах с многоядерными камнями, пусть не очень быстро, но все же увеличивается, так что наступление «золотого века» таких камней – лишь вопрос времени, хоть и довольно длительного.

Так что если вы покупаете процессор «на долгие годы» и не собираетесь его менять, пока он сам не отправится на тот свет (а случиться это событие может очень и очень нескоро), почему бы не сделать эдакую «инвестицию в будущее» и не приобрести Athlon II X4? UP

О необходимости многоголовости
Казалось бы, уже сколько лет прошло с момента выпуска первого двухъядерного процессора для настольных компьютеров, а меж тем процент программного обеспечения, действительно выигрывающего в быстродействии при переносе на «многоголовую» платформу, остается чудовищно малым. В основном это, конечно, касается программ общего назначения – серьезные специализированные пакеты разработчики все-таки стараются оптимизировать без промедления. Но вряд ли из рядовых ресурсоемких приложений, которыми вы привыкли пользоваться, наберется хотя бы одна треть таких, которые действительно могут быстрее выполняться на современных многоядерных камнях.

Чем же вызвана подобная ситуация? В наибольшей степени сложностью эффективного распараллеливания программ. Дело в том, что «классический» код исполняется в общем случае линейно, и последующие команды нередко оперируют результатами работы предыдущих. Нельзя просто бездумно взять первую часть программы и отправить ее выполняться на одном ядре, а вторую – на другом: без грамотной организации обмена данными между потоками (или же исключения необходимости в таковом) ничего не получится.

Похожая ситуация и у современных видеокарт AMD / ATI, основной частью графических процессоров которых, как известно, являются так называемые SIMD-ядра: шейдерные блоки в них способны выполнять до пяти инструкций одновременно, но лишь в том случае, если те независимы по данным. Если же для обработки одной из команд нужно знать результат вычисления предыдущей – все, распараллеливания не будет, и операциям придется «становиться в очередь».
Итак, какие же инструкции можно разбить на потоки сравнительно легко?

Ну, например, однотипные математические вычисления – скажем, подсчет квадратных корней чисел от нуля до миллиона: делим этот диапазон на части и отправляем каждую исполняться на свое ядро, а затем собираем результаты воедино. Также вполне реально распараллелить кодирование видео, музыки или изображений, обработку больших объемов текста, операции поиска – достаточно лишь предоставить каждому условно-независимому вычислительному устройству свою часть работы.

В случае же невозможности этого многоядерный процессор будет напоминать группу из нескольких рабочих с одной лопатой: лишенные инструмента, конечно, будут пытаться помочь обладающему оным, но итоговая производительность у них выйдет не сильно большей, чем у одного полностью «укомплектованного» копателя. А вот если выдать, скажем, одному лопату, другому ведро, а третьему тачку, то в целом работы на участке будут продвигаться быстрее. В соответствии с этим принципом построен иной вариант использования многоядерных камней: выполнение на каждом ядре своей программы.

Именно так работают современные операционные системы, которые умеют распределять независимые процессы по ядрам. Так что если вы и не добьетесь на оснащенным такой ОС многоядерном компе ускоренного выполнения одной задачи, то хотя бы не столкнетесь с торможением одной программы, вызванным обработкой определенного числа других, – если, конечно, они не обращаются одновременно к одному и тому же узлу, например жесткому диску. Но эта обширная тема явно выходит за рамки данной практической статьи.

Никто не прокомментировал материал. Есть мысли?