12 лет назад 17 мая 2012 в 0:36 854

Слухи о новой архитектуре GPU, Kepler, давно будоражили IT-тусовку. В онлайн-издания просачивалась неподтвержденная информация о том, что новая видеокарта увидит свет уже в начале года. Но долгожданный релиз NVIDIA GTX 680 состоялся только 22 марта.

Четыре месяца, прошедшие с того момента, как AMD прогремела на весь свет, показав Tahiti, это одновременно и плохо для NVIDIA, и хорошо. С одной стороны, AMD Radeon 7970 и его «младшие братья» крепко пустили корни на рынке, и те, кто хотел приобретать мощную видеокарту, уже ее приобрели.

С другой – инженеры NVIDIA, изучив слабые места Tahiti (а их немного!), имели возможность внести коррективы, пусть даже в последний момент. По меньшей мере на момент анонса они точно знали, с чем им предстоит побороться. Теперь давайте мысленно взглянем на то, что получилось.

По утверждению NVIDIA, GTX 680 – самая быстрая одночиповая видеокарта, не имеющая аналогов. Техпроцесс 28 нм, целый гигагерц частоты GPU с поддержкой технологии GPU Boost, то есть автоматическим динамическим разгоном.

Ширина шины памяти в 256 бит не вызывает восхищения, и, чтобы не допустить падения производительности по этой причине, впервые используются чипы GDDR5, эффективная штатная частота которых составляет 6000 МГц. На референсной плате устанавливается 2 Гбайт GDDR5 от Hynix с маркировкой H5GQ2H24MFR-R0C. Но к дизайну платы я еще вернусь.

Как и в видеочипе Fermi, в GPU Kepler использован модульный дизайн GPU. Вычислительные мощности поделены на четыре больших модуля, называемые Graphics Processing Cluster (GPC). Отдельно «смонтированы» кэш-блоки, контроллеры памяти, которых стало четыре вместо шести у Fermi, растеризаторы (ROP). Также вне модулей расположено устройство, распределяющее потоки данных между ними, – GigaThread Engine.

В свою очередь, каждый из модулей GPC включает в себя два мультипроцессора SMX, с полиморфным «движком», блоком обработки текстур и тесселятором. В Fermi они назывались SM. В «старой» архитектуре мультипроцессор был основан на 32 ядрах CUDA, в SMX же используются 192 ядра CUDA. В пересчете на 8 мультипроцессоров SMX и получается 1536 шейдерных блоков. Производительность PolyMorph Engine 2.0 в два раза выше, чем в Fermi.

Самый важный вывод из абзаца таков: инженеры NVIDIA держат курс на максимальное увеличение исполнительных устройств в одном мультипроцессоре SMX, одновременно увеличивая их производительность. А если рассматривать структуру чипа более глобально, то можно прийти к выводу, что GPU Kepler – это на самом деле серьезно доработанный Fermi. Несмотря на некоторые существенные отличия видеочипов старого и нового образца, новый тонкий техпроцесс и значительно меньшее энергопотребление, они имеют схожую структуру.

Теперь расскажу наконец о железе. Референсные образцы распаяны на черном текстолите. Разъемы питания, их два, шестипиновых, «смотрят» не вверх, как раньше, а назад, причем для экономии площади платы они установлены «бутербродом», один над другим. Несколько странно выглядит еще одно шестипиновое гнездо, которое направлено вверх. Задел на вырост или артефакт из прошлого? Подсистема питания скомпонована необычно, ее силовые элементы расположены в ряд горизонтально.

ШИМ-контроллер Richtek RT8802A поддерживает управление пятью фазами питания GPU, но распаяно «всего» четыре. Питание модулей памяти двухфазное, так что окончательная формула референсного питальника – 4 + 2. С учетом заявленной мощности 195 Вт этого количества фаз должно хватить, особенно учитывая жесткое ограничение потребляемой мощности, заложенное в видеокарту. Особенность контроллера – поддержка программного изменения выходных параметров, а значит, оверклокерам будет доступен софтвольтмод.

Впервые с незапамятных времен графическое ядро обходится без крышки теплораспределителя. Кристалл защищает металлическая рамка (как у AMD Radeon HD 7970), но одновременно и малый размер чипа усложняет его скалывание. Вообще, система охлаждения претерпела страннейшую метаморфозу. Разработчики как будто проигнорировали достижения технологий, тепловые трубки и теплораспределительную камеру, гордость GTX 580.

Алюминиевая «рама», к которой прижимаются через терморезинки чипы памяти и ключевые элементы преобразователя, осталась практически неизменной, а вот радиатор упрощен до алюминиевой болванки с медной пластиной в основании. Ноу-хау этого теплорассеивателя – скошенные пластины, что должно облегчить прохождение воздуха с одновременным уменьшением шума. Но NVIDIA не была бы собой, не пойдя на какую-то хитрость (форма ребер не в счет).

Оказывается, внутри столь тривиального алюминиевого радиатора спрятаны три тепловые трубки плоской формы, призванные распределять тепло по всей площади радиатора. Эффективность системы охлаждения покажет только тестирование и еще рано делать выводы. Но вендорам в любом случае будет где проявить фантазию. И мне кажется, кто-то из партнеров NVIDIA вернется к конструкции с тепловой камерой «а-ля 580», и уже сегодня в пресс-релизах я видел анонсы плат с предустановленными ватерблоками Full Cover.

Итак, на сей момент кратко, но доходчиво я постарался показать, что: GTX 680 просто обязана быть быстрой (новые мультипроцессоры SMX) и энергоэффективной (новая схема питания, тонкий техпроцесс). О чем я забыл, так это о плавности отображения и сглаживании. Улучшить первое призвана система «Адаптивный VSync», или, понятнее, вертикальной синхронизации. Она и раньше применялась у NVIDIA, но ее включение порой приводило к фатальному падению fps.

С этим явлением справились, и теперь нет «разрыва» картинки и провалов fps. Что же касается сглаживания, отныне аппаратный антиалиасинг называется TXAA 2. Показанные в прошлом году средства TXAA 1 были сравнимы по результатам с 8 x MSAA, TXAA 2 позволяет достичь лучших результатов сглаживания при меньшем расходе вычислительных мощностей. «Блюрит» хорошо (trollface).

Теперь о насущном – о программном обеспечении и оверклокинге. Драйверы, конечно, нужны новые. В пресс-ките NVIDIA распространяет версию 300.99 (на сайте уже есть 301.10. – Прим. ред.). А вот с разгоном пока не очень понятно. На данный момент единственная утилита, поддерживающая Kepler, называется EVGA PrecizionX, и те, кому уже удалось «покрутить ручки», пребывают в некотором недоумении. Как и ожидалось, интеллектуальные функции лимитирования энергопотребления и GPU Boost сильно мешают энтузиастам.

Есть вопросы и к установке напряжений GPU и памяти, не у всех смена значений на что-то повлияла. Тем не менее, поговаривают, можно выжать почти 7 ГГц по памяти и 1,05 ГГц по ядру. Дальше процессор сам определит, на сколько он готов поднимать частоту, чтобы не выскочить за рамки позволенной мощности. В презентации заявлены 1,2 ГГц на GPU, но на практике типичный GPU Clock разогнанной видюхи – 1,15 ГГц.

А надо ли разгонять эту видеокарту? Ведь, судя по материалам презентации, ее производительность не ниже AMD Radeon HD 7970, а в некоторых играх, например в Battlefield 3, выше в полтора раза. Синтетические тесты показывают паритет архитектур AMD и NVIDIA, достигнутый разными средствами. Результаты оверклокинга сэмплов демонстрируют, что прирост fps в целом невелик, а с учетом особенностей нового графического процессора еще и сопряжен с трудностями. Вот что не менее интересно – SLI-конфигурации, ведь энергопотребление в целом небольшое, и результат будет виден сразу и воочию.

Осталась нерешенной и головоломка с названием чипа. Дав новому GPU индекс 104, NVIDIA не ответила на резонный вопрос: «А где сто десятый?» Ведь по существующей номенклатуре Fermi 104 – это середина линейки. Выходит, пара тузов в рукавах остались-таки спрятаны (смайл).

Подводя итоги, можно сказать, что NVIDIA, несмотря ни на что, выпустила очень интересный продукт. И бенчмаркеров впереди ждет много интересных сессий. Даже то, что чип Kepler фактически оказался до блеска отполированным Fermi, не смазывает впечатления. Карта получилась энергоэффективной, мощной, малошумной. Если сравнивать ее с топовым продуктом конкурентов, AMD Radeon HD 7970, видно, что они выступают в одной весовой категории. Как обычно, победителя выберут покупатели, цена не самый последний аргумент для них.

А если AMD отреагирует на выход GTX 680 какой-то разогнанной версией 7970, то NVIDIA даже при существующем дизайне платы может выпустить Ti-версию, запас мощности и частоты пока есть. И ощущение, что сегодня я описал не самую могучую видюху, меня не покидает.

Обещаем, что обзор новинки (причем не с лого NVIDIA на кожухе, а одного из вендоров, но какого – пока секрет) вы увидите в следующем номере. Следите за публикациями. UP

Никто не прокомментировал материал. Есть мысли?