Современные графические процессоры содержат множество функциональных блоков, от количества и характеристик которых зависит и итоговая скорость рендеринга, влияющая на комфортность эксплуатации. По сравнительному количеству этих блоков в разных видеочипах можно примерно оценить, насколько быстр тот или иной GPU. Характеристик у видеочипов довольно много, и мы рассмотрим самые важные из них.
Тактовая частота видеочипа
Рабочая частота GPU измеряется в мегагерцах (в миллионах тактов в секунду). Эта характеристика прямо влияет на производительность видеочипа, чем она выше, тем больший объем работы чип может выполнить в единицу времени, обработать большее количество вершин и пикселей. Пример из реальной жизни: частота видеочипа, установленного на плате RADEON X1900 XTX равна 650 МГц, а точно такой же чип на RADEON X1900 XT работает на частоте в 625 МГц. Соответственно будут отличаться и все основные характеристики производительности. Однако рабочая частота чипа не единолично определяет производительность. На его скорость также сильно влияет и архитектура: количество различных исполнительных блоков, их характеристики и т.п.
В последнее время участились случаи, когда тактовая частота для отдельных блоков GPU отличается от частоты работы всего остального чипа. То есть, разные части видеокарты работают на разных частотах. Сделано это с целью повышения эффективности, ведь некоторые блоки способны работать на повышенных частотах, а другие — нет. Из недавних примеров можно назвать семейство GeForce 8800 от NVIDIA. Видеочип модели GTS работает на частоте 512 МГц, но универсальные шейдерные блоки тактуются на значительно более высокой частоте — 1200 МГц.
Скорость заполнения (филлрейт)
Скорость заполнения показывает, с какой скоростью видеочип способен отрисовывать пиксели. Различают два типа филлрейта:
пиксельный (pixel fill rate)
текстурный (texel rate)
Пиксельная скорость заполнения показывает скорость отрисовки пикселей на экране и зависит от рабочей частоты и количества блоков ROP (блоков операций растеризации и блендинга) (см. далее), а текстурная — это скорость выборки текстурных данных, которая зависит от частоты работы и количества текстурных блоков.
Например, пиксельный филлрейт у GeForce 7900 GTX равен 650 (частота чипа) * 16 (количество блоков ROP) = 10400 мегапикселей в секунду, а текстурный — 650 * 24 (кол-во блоков текстурирования) = 15600 мегатекселей/с. Чем больше первое число — тем быстрее видеокарта может отрисовывать готовые пиксели, а чем больше второе — тем быстрее производится выборка текстурных данных. Для современных игр чрезвычайно важны обы параметра, но они должны быть сбалансированы. Именно поэтому количество блоков ROP в чипах семейства G7x, на которых построено семейство GeForce 7, меньше количества текстурных и пиксельных блоков.
Количество блоков пиксельных процессоров (шейдеров)
Пиксельные процессоры — это одни из главных блоков видеочипа, которые выполняют специальные программы, известные как пиксельные шейдеры. По числу блоков пиксельных шейдеров и их частоте можно сравнивать шейдерную производительность разных видеокарт. Современные игры по большей части ограничены производительностью исполнения пиксельных шейдеров. Поэтому количество этих блоков крайне важно. Если одна модель видеокарты основана на GPU с 8 блоками пиксельных шейдеров, а другая из той же линейки — 16 блоками, то при прочих равных вторая будет вдвое быстрее обрабатывать пиксельные программы, и в целом будет производительнее.
Однако справедливости ради скажем, что на основании одного лишь количества блоков делать однозначные выводы не стоит. Обязательно нужно учесть и тактовую частоту и разновидность архитектуры блоков разных поколений и производителей чипов. По цифрам, отображающим шейдерную производительность, прямо можно сравнивать чипы только в пределах одной линейки от одного производителя. В других же случаях следует обращать внимание на тесты производительности в контексте интересующих игровых или рабочих приложений.
Количество блоков вершинных процессоров (шейдеров)
Аналогично предыдущему пункту, эти блоки выполняют программы шейдеров, но уже вершинных. Данная характеристика важна для некоторых приложений, но не так явно, как предыдущая. Блоки вершинных шейдеров почти никогда не бывают загружены и наполовину даже самыми последними играми. И, так как производители балансируют количество разных блоков, не позволяя возникнуть большому перекосу в распределении сил, количеством вершинных процессоров при выборе видеокарты вполне можно пренебречь, учитывая их только при прочих равных характеристиках.
Количество блоков универсальных процессоров (унифицированных шейдерных)
Унифицированные шейдерные блоки объединяют два типа перечисленных выше блоков. Они в состоянии исполнять как вершинные, так и пиксельные программы (а также геометрические, которые появились в DirectX 10). Впервые унифицированная архитектура была применена в видеочипе игровой консоли Microsoft Xbox 360. Данный графический процессор был разработан компанией ATI. А в видеочипах для персональных компьютеров унифицированные шейдерные блоки появились не так давно, с появлением плат NVIDIA GeForce 8800. И, похоже, что все совместимые с DirectX 10 видеочипы будут основаны на подобной унифицированной архитектуре.
Унификация блоков шейдеров значит, что код разных шейдерных программ (вершинных, пиксельных и геометрических) универсален, и соответствующие унифицированные процессоры могут выполнить любые программы из вышеперечисленных. Соответственно, в новых архитектурах число пиксельных, вершинных и геометрических шейдерных блоков сливается в один показатель — количество универсальных процессоров.
Блоки наложения текстур (TMU)
TMU (Texture Mapping Unit) осуществляет выборку и фильтрацию текстурных данных, необходимых для построения сцены изображения. Эта работа выполняется TMU совместно с блоками пиксельных и вершинных шейдеров. Число текстурных блоков в видеочипе определяет текстурную производительность, скорость выборки из текстур. И хотя в последнее время большая часть расчетов осуществляется блоками шейдеров, нагрузка на блоки TMU до сих пор довольно велика, и с учетом упора некоторых игр в производительность блоков текстурирования, можно сказать, что количество блоков TMU и соответствующая высокая текстурная производительность являются одними из важнейших параметров видеочипов. Особое влияние этот параметр оказывает на скорость при использовании трилинейной и анизотропной фильтраций, требующих дополнительных текстурных выборок. Вполне разумно предположить, что видеокарта с большим числом TMU даст более высокую текстурную производительность.
Блоки операций растеризации (ROP)
ROP (Raster Operator Unit) – это блоки растеризации, осуществляющие операции записи рассчитанных видеокартой пикселей в буферы и операции их смешивания (блендинга). Как мы уже отмечали выше, производительность блоков ROP влияет на филлрейт и это — одна из основных характеристик видеокарт всех времен. И хотя в последнее время её значение несколько снизилось, еще попадаются случаи, когда производительность некоторых приложений сильно зависит от скорости и количества блоков ROP. Чаще всего это объясняется высокими игровыми настройками и активным использованием фильтров постобработки (преобразующих цветные изображения в оттенки серого, с целью его полной или частичной конвертации), включенным анти-алиасингом (по-английски: Anti-aliasing – способ борьбы с нежелательным искажением контура, когда зубчики на контуре фрагмента изображения могут быть минимизированы с помощью применения точек различных цветов по краю контура, и он как бы размывается по экрану и приобретает видимость гладкой линии) и анизотропной фильтрации (по-английски: Anisotropic Filtering, AF – метод улучшения качества изображения текстур на поверхностях, находящихся в отдалении и сильно наклонённых относительно камеры в трёхмерной графике).
Конвейеры
Конвейеры используются для описания архитектуры видеокарт и дают вполне наглядное представление о производительности графического процессора.
Конвейер нельзя считать строгим техническим термином. В графическом процессоре используются разные конвейеры, которые выполняют отличающиеся друг от друга функции. Исторически под конвейером понимали пиксельный процессор, который был подключён к своему блоку наложения текстур (TMU). Например, у видеокарты Radeon 9700 используется восемь пиксельных процессоров, каждый из которых подключён к своему TMU, поэтому считают, что у карты восемь конвейеров.
Но современные видеоплаты описать числом конвейеров весьма сложно. По сравнению с предыдущими дизайнами, новые графические процессоры используют модульную, фрагментированную структуру. Новатором в этой сфере можно считать ATi, которая с линейкой видеокарт X1000 перешла на модульную структуру, что позволило достичь прироста производительности через внутреннюю оптимизацию. Некоторые блоки процессора используются больше, чем другие, и для повышения производительности графического процессора ATi постаралась найти компромисс между числом нужных блоков и площадью кристалла (её нельзя очень сильно увеличивать). В данной архитектуре термин "пиксельный конвейер" уже потерял своё значение, поскольку пиксельные процессоры уже не подключены к собственным блокам TMU. Например, у графического процессора ATi Radeon X1600 было 12 блоков пиксельных шейдеров и всего четыре блока наложения текстур TMU. Поэтому нельзя говорить, что в архитектуре этого процессора есть 12 пиксельных конвейеров, как и говорить, что их всего четыре. Впрочем, по традиции пиксельные конвейеры всё ещё упоминают.
Видеопамять
Следующий фактор, на который следует обращать внимание при покупке видеокарты, это видеопамять.
Видеопамять – это место где хранится картинка, пока видеокарта ожидает ввода новых данных. Естественно чем больше у вас видеопамяти – тем лучше, однако покупать видеокарту с большим объемом видеопамяти имеет смысл, только если вы являетесь геймером. Особо хотелось бы отметить что видеопамять, в отличие от оперативной памяти, нельзя наращивать.
Объем видеопамяти
Собственная память используется видеочипами для хранения необходимых данных: текстур, вершин, буферов и т.п. Казалось бы, что чем её больше — тем лучше. Но не всё так просто. Оценка мощности видеокарты по объему видеопамяти — наиболее распространенная ошибка. Значение объема памяти неопытные пользователи переоценивают чаще всего, используя его для сравнения разных моделей видеокарт. Оно и понятно — логично предположить, что раз параметр, указываемый во всех источниках одним из первых, в два раза больше, то и скорость у решения должна быть в два раза выше. Реальность же от этого мифа отличается тем, что рост производительности растет до определенного объема и после его достижения попросту останавливается.
В каждой игре есть определенный объем видеопамяти, которого хватает для всех данных, и хоть 4 ГБ туда поставь — у нее не появится причин для ускорения рендеринга, скорость будут ограничивать исполнительные блоки, о которых речь шла выше. Поэтому то во многих случаях видеокарта с 512 Мбайт видеопамяти будет работать с той же скоростью, что и карта с 1024 Мбайт, при прочих равных условиях. Ситуации, когда больший объем памяти приводит к видимому увеличению производительности существуют, но это касается очень требовательных игр в высоких разрешениях и при максимальных настройках. Но такие случаи до сих пор редки, поэтому, объем памяти учитывать нужно, но, не забывая о том, что выше определенного объема производительность просто не растет, есть более важные параметры, такие как ширина шины памяти и ее рабочая частота.
Ширина шины памяти
Ширина шины памяти является важнейшей характеристикой, влияющей на пропускную способность памяти (ПСП). Большая ширина позволяет передавать большее количество информации из видеопамяти в GPU и обратно в единицу времени, что положительно влияет на производительность в большинстве случаев. Теоретически, по 128-битной шине можно передать в два раза больше данных за такт, чем по 64-битной. На практике разница в скорости рендеринга хоть и не достигает двойного увеличения, но весьма близка к этому во многих случаях с упором на пропускную способность видеопамяти.
Современные видеокарты используют разную ширину шины: от 64 до 512 бит, в зависимости от ценового диапазона и времени выпуска конкретной модели GPU. Для low-end видеокарт чаще всего используется 64- и (значительно реже) 128-бит, для среднего уровня 128-бит и иногда 256-бит, ну а high-end видеокарты используют шины от 256 до 512 бит шириной.
Частота видеопамяти
Еще одним параметром, влияющим на пропускную способность памяти, является её тактовая частота. А как мы поняли выше, повышение ПСП прямо влияет на производительность видеокарты в 3D приложениях. Частота шины памяти на современных видеокартах бывает от 500 МГц до 2000 МГц, то есть может отличаться в четыре раза. И так как пропускная способность памяти зависит и от частоты памяти и от ширины ее шины, то память с 256-битной шиной, работающая на частоте 1000 МГц, будет иметь большую пропускную способность, по сравнению с 1400 МГц памятью с 128-битной шиной.
Особенное внимание на параметры ширины шины памяти и частоты ее работы следует уделять при покупке недорогих видеокарт, на многие из которых ставят лишь 64-битные интерфейсы, что сильно сказывается на их производительности. Вообще, покупка решений на базе 64-битной шины для игр вовсе не рекомендуется.
Типы памяти
На видеокарты устанавливают несколько различных типов памяти. Старую SDR память с одинарной скоростью передачи мы рассматривать не будем, её уже почти нигде не встретишь. Все современные типы памяти DDR и GDDR позволяют передавать в два раза большее количество данных на той же тактовой частоте за единицу времени, поэтому цифру её рабочей частоты зачастую умножают вдвое. Так, если для DDR памяти указана частота 1400 МГц, то эта память работает на физической частоте в 700 МГц, но указывают так называемую «эффективную» частоту, то есть ту, на которой должна работать SDR память, чтобы обеспечить такую же пропускную способность.
Основное преимущество DDR2 памяти заключается в возможности работы на больших тактовых частотах, а соответственно — увеличении пропускной способности по сравнению с предыдущими технологиями. Это достигается за счет увеличенных задержек, которые, впрочем, не так важны для видеокарт. Первой платой, использующей DDR2 память, стала NVIDIA GeForce FX 5800 Ultra. По сути, на ней стояла GDDR2 память, которая не настоящая DDR2, а нечто среднее между технологиями DDR и DDR2. После применения GDDR2 в серии GeForce FX 5800, последующие видеокарты NVIDIA использовали DDR память, но эта память получила дальнейшее распространение в GeForce FX 5700 Ultra и в некоторых более поздних mid-end видеокартах. С тех пор технологии графической памяти продвинулись дальше. Был разработан стандарт GDDR3, который близок к спецификациям DDR2, с некоторыми изменениями, сделанными специально для видеокарт.
GDDR3 — это специально предназначенная для видеокарт память, с теми же технологиями, что и DDR2, но с улучшениями характеристик потребления и тепловыделения, что позволило создать микросхемы, работающие на более высоких тактовых частотах. И опять же, несмотря на то, что стандарт был разработан в ATI, первой видеокартой, ее использующей, стала вторая модификация NVIDIA GeForce FX 5700 Ultra, а следующей стала GeForce 6800 Ultra.
GDDR4 — это дальнейшее развитие «графической» памяти, работающее почти в два раза быстрее, чем GDDR3. Основными отличиями GDDR4 от GDDR3, существенными для пользователей, являются в очередной раз повышенные рабочие частоты и сниженное энергопотребление. Технически, память GDDR4 не сильно отличается от GDDR3, это дальнейшее развитие тех же идей. Первыми видеокартами с чипами GDDR4 на борту стали RADEON X1950 XTX, а у компании NVIDIA продукты на базе этого типа памяти еще не вышли. Преимущества новых микросхем памяти перед GDDR3 в том, что энергопотребление модулей может быть примерно на треть ниже. Это достигается за счет более низкого номинального напряжения для GDDR4.
Начиная с GPU семейства RV7x0, контроллерами памяти видеокарт поддерживается новый тип памяти GDDR5, работающий на эффективно учетверённой частоте до 4 ГГц и выше (теоретически предполагается до 7 ГГц), что даёт пропускную способность до 120 ГБ/с с применением 256-битного интерфейса. Если для повышения ПСП у GDDR3/GDDR4 памяти приходилось использовать 512-битную шину, переход на использование GDDR5 позволяет увеличить производительность вдвое при меньших размерах чипов и меньшем потреблении энергии. Первые чипы поддерживают напряжение 1.5 В (в отличие от 2.0 В для GDDR3, к примеру) и предлагают скорости до 1000*4=4.0 ГГц.
Итак, видеопамять самых современных типов: GDDR3 и GDDR5, отличается от DDR некоторыми деталями, но также работает с удвоенной/учетверённой передачей данных. В ней применяются некоторые специальные технологии, позволяющие поднять частоту работы. Так, GDDR2 память обычно работает на более высоких частотах, по сравнению с DDR, GDDR3 — на еще более высоких, а GDDR5 обеспечивает максимальную частоту и пропускную способность на данный момент.
Итог
Подводя итог этому краткому обзору характеристик, нужно еще раз отметить, что современные видеочипы нельзя оценивать только числом разнообразных блоков и их частотой. Каждая серия видеокарт использует новую архитектуру, в которой исполнительные блоки сильно отличаются от старых, да и соотношение количества разных блоков может отличаться. Компания ATi первой применила архитектуру, в которой количество блоков пиксельных шейдеров было в разы больше числа блоков текстурирования. Это было сделано немного преждевременно, но в некоторых приложениях пиксельные блоки используются более активно, чем остальные и для таких приложений подобное решение будет неплохим вариантом, не говоря уже о будущем. Также, в недавней архитектуре AMD(ATi) нет отдельных пиксельных конвейеров, пиксельные процессоры не «привязаны» к блокам TMU. Впрочем, у NVIDIA в GeForce 8800 получилось еще сложнее.
Описания товаров в каталоге интернет-магазина «Технопанда» подготовлены на основе информации, взятой из открытых источников, в том числе с официальных сайтов производителей, что не исключает наличия ошибок и неточностей. Помимо этого, производители оставляют за собой право вносить изменения в характеристики, комплектацию, внешний вид товаров без предварительного уведомления. Необходимо помнить также, что один товар может выпускаться в разных модификациях. Поэтому мы не утверждаем, что все представленные в каталоге сведения о товарах точны и в полной мере соответствуют действительности.
Администрация интернет-магазина «Технопанда» рекомендует, при совершении заказа, уточнять у наших специалистов значимые для Вас параметры и характеристики товаров.