Кількість обчислювальних (шейдерних) блоків чи процесорів. Відеокарта, як вибрати FAQ щодо характеристик при виборі відеокарти. Технології, особливості виробників та архітектур, системи охолодження Кількість шейдерних процесорів

На нашому форумі щодня десятки людей просять консультації з питань модернізації своїх, у чому ми охоче їм допомагаємо. Щодня «оцінюючи складання» і перевіряючи обрані нашими клієнтами компоненти на сумісність, ми стали помічати, що увагу користувачі приділяють в основному та іншим, безперечно, важливим комплектуючим. І рідко хтось згадує, що при апгрейді комп'ютера потрібно обов'язково оновити не менш важливу деталь – . І сьогодні ми розповімо та покажемо, чому про це не варто забувати.

«…Хочу прокачати комп'ютер щоб все літало, купив проц i7-3970X і мамку ASRock X79 Extreme6, плюс бачу RADEON HD 7990 6Гб. Що ще нан????777»
- приблизно так починаються близько половини всіх повідомлень щодо оновлення стаціонарного комп'ютера. Виходячи зі свого або сімейного бюджету, користувачі намагаються вибрати саму, саму і найшвидші і красиві модулі пам'яті. При цьому, наївно вважаючи, що їх старенький на 450Вт впорається і з ненажерливою відеокартою, і з гарячим процесором під час розгону одночасно.

Ми, зі свого боку, вже жодного разу писали про важливість блоку живлення – але, каємось, напевно, це було недостатньо наочно. Тому сьогодні ми виправилися, і підготували для вас пам'ятку про те, що буде, якщо при апгрейді вашого ПК ви забудете про - з картинками та докладними описами.

Отже, ми вирішили оновити конфігурацію.

Для нашого експерименту ми вирішили взяти абсолютно новий середньостатистичний комп'ютер і оновити його до рівня «ігрова машина». Конфігурацію сильно змінювати не доведеться - достатньо буде поміняти, пам'ять та відеокарту, щоб у нас з'явилася можливість пограти в більш-менш сучасні ігри при гідних налаштуваннях деталізації. Початкова конфігурація нашого комп'ютера така:

Блок живлення: ATX 12V потужністю 400 Вт

Зрозуміло, що для ігор така конфігурація, м'яко кажучи, слабенька. Значить, настав час щось міняти! Почнемо ми з того ж, з чого починає більшість спраглих «апгрейду» - с. Материнську плату ми не мінятимемо – поки нас вона влаштовує.

Так як материнську плату ми вирішили не чіпати, то підберемо сумісний із сокетом FM2 (благо, для цього на сайті НІКС є спеціальна кнопка на сторінці опису материнської плати). Не скупитимемося – візьмемо доступний, але швидкий і потужний процесор з частотою 4.1 ГГц (до 4.4 ГГц в режимі Turbo СORE) і розблокованим множником – ми теж любимо «розганяти», ніщо людське нам не чуже. Ось характеристики вибраного нами процесора:

Характеристики

Частота шини CPU

5000 МГц

Розсіювана потужність

100 Вт

Частота роботи процесора

4.1 ГГц або до 4.4 ГГц у режимі Turbo СORE

Ядро

Richland

Кеш L1

96 Кб x2

Кеш L2

2048 Кб x2, працює на частоті процесора

Підтримка 64 біт

Так

кількість ядер

множення

41, незаблокований множник

Відеоядро процесора

AMD Radeon HD 8670D із частотою 844 МГц; підтримка Shader Model 5

Max обсяг оперативної пам'яті

64 Гб

Макс. кількість моніторів, що підключаються

3 з прямим підключенням або до 4 моніторів під час використання DisplayPort розгалужувачів

Одна планка на 4Гб – не наш вибір. По-перше, ми хочемо 16Гб, а по-друге – нам потрібно задіяти двоканальний режим роботи, для чого в наш комп'ютер ми встановимо два модулі пам'яті об'ємом по 8Гб кожен. Висока пропускна спроможність, відсутність радіаторів і гідна ціна роблять ці найсмачнішим вибором для нас. До того ж, з сайту AMD можна завантажити програму Radeon RAMDisk, яка дозволить нам безкоштовно створити супершвидкий віртуальний накопичувач об'ємом до 6Гб абсолютно безкоштовно – а безкоштовні корисні штуки люблять усі.

Характеристики
Обсяг пам'яті	8 Гб
Кількість модулів	2
Стандарт пам'яті	PC3-10600 (DDR3 1333 МГц)
Частота функціонування	до 1333 МГц
Таймінги	9-9-9-24
Напруга живлення	1.5 У
Пропускна здатність	10667 Мб/сек

Грати на вбудованому відео з комфортом можна тільки в сапері. Тому для того, щоб оновити комп'ютер до ігрового рівня, ми вибрали сучасну та потужну, але не найдорожчу.

Їй стала з 2Гб відеопам'яті, підтримкою DirectX 11 та OpenGL 4.x. та відмінною системою охолодження Twin Frozr IV. Її продуктивності з лишком має вистачити для того, щоб ми могли насолодитися найновішими частинами найпопулярніших ігрових франшиз, як Tomb Raider, Crysis, Hitman і Far Cry. Характеристики обраної нами виглядають так:

Характеристики
GPU	GeForce GTX 770
Частота GPU	1098 МГц або до 1150 МГц у режимі GPU Boost
Кількість шейдерних процесорів	1536
Відеопам'ять	2 Гб
Тип відеопам'яті	GDDR5
Розрядність шини відеопам'яті	256 біт
Частота відеопам'яті	1753 МГц (7.010 ГГц QDR)
Кількість піксельних конвеєрів	128, 32 блоки вибірки текстур
Інтерфейс	PCI Express 3.0 16x (сумісний з PCI Express 2.x/1.х) з можливістю об'єднання карт за допомогою SLI.
Порти	DisplayPort, DVI-D, DVI-I, HDMI, Перехідник на D-Sub у комплекті
Охолодження відеокарти	Активне (радіатор + 2 вентилятори Twin Frozr IV на лицьовій стороні плати)
Роз'єм живлення	8 pin+8 pin
Підтримка API	DirectX 11 та OpenGL 4.x
Довжина відеокарти (виміряно в НІКС)	263 мм
Підтримка обчислень загального призначенняна GPU	DirectCompute 11, NVIDIA PhysX, CUDA, CUDA C++, OpenCL 1.0
Максимальне енергоспоживання FurMark+WinRar	255 Вт
Рейтинг продуктивності	61.5

Несподівані труднощі

Тепер все, що потрібне для апгрейду нашого комп'ютера, у нас є. Встановимо нові комплектуючі в корпус, що у нас є.

Запускаємо – і не працює. А чому? А тому, що бюджетні блоки живлення фізично не здатні запустити комп'ютер з будь-якої хоч трохи. Справа в тому, що для живлення в нашому випадку потрібні два 8-pin конектори, а блок живлення має «в базі» всього один 6-pin конектор живлення відеокарти. Враховуючи, що набагато більше потрібно ще більше конекторів, ніж у нашому випадку, стає зрозуміло, що блок живлення потрібно міняти.

Але це ще півбіди. Подумаєш, немає конектора живлення! У нашій тестовій лабораторії знайшлися досить рідкісні перехідники з 6-pin на 8-pin та з molex на 6-pin. Ось такі:

Варто зазначити, що навіть на бюджетних сучасних блоках живлення з кожним новим випуском роз'ємів Molex стає дедалі менше – тому нам, можна сказати, пощастило.

На перший погляд – все добре, і за допомогою деяких хитрощів ми змогли оновити системний блокдо "геймерської" конфігурації. Тепер давайте зімітуємо навантаження, запустивши на нашому новому ігровому комп'ютері тест Furmark та архіватор 7Zip у режимі Xtreme Burning одночасно. Ми могли запустити комп'ютер вже добре. Запуск Furmark система також витримала. Запускаємо архіватор – і що це? Комп'ютер вимкнувся, перед цим порадувавши нас ревінням розкрученого на максимум вентилятора. "Скоромний" штатний 400Вт не зумів, як не намагався, прогодувати відеокарту та потужний процесор. А через посередню систему охолодження наш сильно нагрівся, і навіть максимальні обороти вентилятора не дозволили йому видати хоча б заявлені 400Вт.

Вихід є!

Припливли. Купили дорогі комплектуючі, щоби зібрати ігровий комп'ютер, а грати на ньому, виходить, не можна. Прикро. Висновок зрозумілий усім: старий не підходить для нашого ігрового комп'ютера, і його потрібно терміново міняти на новий. Але на який саме?

Для нашого прокаченого комп'ютера ми вибирали за чотирма основними критеріями:

Перший - це, звичайно ж, потужність.Ми вважали за краще вибрати із запасом – нам же захочеться і процесор порозганяти, і в тестах синтетичних балів набрати. З урахуванням того, що може нам знадобитися в майбутньому, ми вирішили обирати потужністю не нижче 800Вт.

Другий критерій – це надійність. Нам дуже хочеться, щоб узятий «із запасом» пережив наступне покоління відеокарт та процесорів, не згорів сам і при цьому не спалив дорогі комплектуючі (разом із тестовим майданчиком). Тому наш вибір – тільки японські конденсатори, тільки захист від коротких замикань і надійний захист від перевантаження будь-якого з виходів.

Третій пункт наших вимог – зручність та функціональність. Для початку, нам потрібен – працювати комп'ютер буде часто, і особливо галасливі БП разом з відеокартою та процесорним кулером зведуть з розуму будь-якого користувача. До того ж, нам не чуже почуття прекрасного, тому новий блок живлення для нашого ігрового комп'ютера повинен бути модульним і мати кабелі та конектори, що відстібаються. Щоб нічого зайвого не було.

І останній за списком, але не за значущістю, критерій – це енергоефективність. Так, нас турбує і довкілля, і рахунки за електрику. Тому обраний нам блок живлення повинен відповідати, як мінімум, стандарту енергоефективності 80+ Bronze.

Зіставивши та проаналізувавши всі вимоги, ми вибрали серед нечисленних претендентів, який максимально повно задовольняв усі наші вимоги. Ним став потужністю 850W. Зауважимо, що за цілою низкою параметрів він навіть перевершив наші вимоги. Давайте подивимося його специфікацію:

Характеристики блоку живлення
тип обладнання	Блок живлення з активним PFC (Power Factor Correction) модулем.
Властивості	Обплетення шлейфів, Японські конденсатори, Захист від коротких замикань (SCP), Захист від підвищення напруги (OVP), Захист від перевантаження будь-якого з виходів блоку окремо (OCP)
+3.3V - 24A, +5V - 24A, +12V - 70A, +5VSB - 3.0A, -12V - 0.5A
Кабелі живлення, що від'єднуються	Так
ККД	90%, Сертифіковано на стандарт 80 PLUS Gold
Потужність блоку живлення	850 Вт
Конектор живлення мат.плати	24+8+8 pin, 24+8+4 pin, 24+8 pin, 24+4 pin, 20+4 pin(розбірний 24-pin конектор. 4-pin можуть відстібатися у разі необхідності, розбірний 8-pin конектор)
Конектор живлення відеокарт	6x 6/8-pin роз'ємів (розбірний 8-pin роз'єм - 2 контакти відстібаються)
MTBF	100 тис. годин
Охолодження блоку живлення	1 вентилятор: 140 х 140 мм (на нижній стінці). Система пасивного охолодження під час навантаження до 50%.
Управління швидкістю обертання вентилятора	Від термодатчика. Зміна швидкості обертання вентилятора в залежності від температури всередині блока живлення. Ручний вибір режиму вентилятора. У режимі Normal вентилятор постійно обертається, а в режимі Silent повністю зупиняється при низькому завантаженні.

один з кращих за ці гроші. Встановимо його в наш корпус:

Тут сталося щось, що нас трохи збентежило. Здавалося б, усе зібрали грамотно, все підключили, все запрацювало – блок живлення мовчить! Тобто взагалі: вентилятор як стояв на місці, так і стоїть, а система при цьому справно запустилася та функціонує. Справа в тому, що при навантаженні до 50% блок живлення працює у так званому тихому режимі – не розкручуючи вентилятор системи охолодження. Загудить вентилятор лише під великим навантаженням – одночасний запуск архіваторів і Furmark таки змусив кулер обертатися.

У блоку живлення цілих шість 8-pin6-pin конекторів живлення відеокарти, кожен з яких являє собою розбірний 8-піновий конектор, від якого при необхідності можна відстебнути 2 контакти. Таким чином, він здатний без зайвого клопоту і труднощів прогодувати будь-яку відеокарту. І навіть не одну.

Модульна система блоку живлення дозволяє відстебнути зайві та непотрібні кабелі живлення, що дозволяє покращити продувність корпусу, стабільність роботи системи та, звичайно ж, естетично покращує зовнішній виглядвнутрішнього простору, що дозволяє сміливо рекомендувати моддерам та любителям корпусів з віконцями.
купити надійний та потужний блок живлення. У нашому огляді ним став. - І як бачите, не випадково. Купивши такий же в НІКС, ви можете бути впевнені в тому, що всі компоненти вашої високопродуктивної системи будуть забезпечені достатнім і безперебійним харчуваннямнавіть при екстремальному оверклокінгу.

До того ж, блоку живлення потужністю вистачить на кілька років уперед – краще із запасом, якщо ви збираєтеся і в майбутньому оновлювати систему високорівневими комплектуючими.

Базові компоненти відеокарти:

виходи;
інтерфейси;
система охолодження;
графічний процесор;
відеопам'ять.

Графічні технології:

словничок;
архітектура графічного процесора: функції
вершинні/піксельні блоки, шейдери, швидкість заповнення, текстурні/растрові блоки, конвеєри;
архітектура графічного процесора: технологія
техпроцес, частота графічного процесора, локальна відеопам'ять (обсяг, шина, тип, частота), рішення з кількома відеокартами;
візуальні функції
DirectX, високий динамічний діапазон (HDR), повноекранне згладжування, текстурна фільтрація, текстури високої роздільної здатності.

Словник базових графічних термінів

Частота оновлення (Refresh Rate)

Як у кінотеатрі чи телевізорі, ваш комп'ютер симулює рух на моніторі, виводячи послідовність кадрів. Частота оновлення монітора вказує на те, скільки разів на секунду на екрані оновлюватиметься картинка. Наприклад, частота 75 Гц відповідає 75 оновлень в секунду.

Якщо комп'ютер обробляє кадри швидше, ніж може виводити монітор, то в іграх можуть виникнути проблеми. Наприклад, якщо комп'ютер прораховує 100 кадрів в секунду, а частота оновлення монітора становить 75 Гц, то через накладки монітор може виводити лише частину картинки за період свого оновлення. У результаті виникають візуальні артефакти.

Як рішення можна увімкнути V-Sync (вертикальну синхронізацію). Вона обмежує кількість кадрів, що видаються комп'ютером, до частоти оновлення монітора, запобігаючи появі артефактів. Якщо увімкнути V-Sync, то кількість кадрів, що прораховуються в грі, ніколи не перевищить частоту оновлення. Тобто при 75 Гц комп'ютер виводитиме не більше 75 кадрів на секунду.

Піксель (Pixel)

Слово "Pixel" розшифровується як " pic ture el ement - елемент зображення. Він являє собою крихітну точку на дисплеї, яка може світитися певним кольором (у більшості випадків відтінок виводиться поєднанням трьох базових кольорів: червоного, зеленого та синього). Якщо роздільна здатність екрана становить 1024×768, то на ньому можна помітити матрицю з 1024 пікселів за шириною та 768 пікселів за висотою. Всі разом пікселі та складають зображення. Картинка на екрані оновлюється від 60 до 120 разів на секунду, залежно від типу дисплею та даних, що видаються виходом відеокарти. ЕПТ-монітори оновлюють дисплей рядок за рядком, а плоскі РК-монітори можуть оновлювати кожен піксель окремо.

Вершина (Vertex)

Усі об'єкти на 3D сцені складаються з вершин. Вершина - точка в тривимірному просторі з координатами X, Y і Z. Декілька вершин можна згрупувати в полігон: найчастіше це трикутник, але можливі складніші форми. Потім на полігон накладається текстура, що дозволяє виглядати об'єкту реалістично. 3D-куб, показаний на ілюстрації вище, складається із восьми вершин. Більш складні об'єкти мають криві поверхні, які насправді складаються з великої кількості вершин.

Текстура (Texture)

Текстура - це просто 2D-картинка довільного розміру, яка накладається на 3D-об'єкт, щоб симулювати його поверхню. Наприклад, наш 3D-куб складається із восьми вершин. До накладання текстури він виглядає як проста коробка. Але коли ми нанесемо текстуру, то коробка стає забарвленою.

Шейдер (Shader)

Піксельні програми-шейдери дозволяє відеокарті видати вражаючі ефекти, наприклад, як цю воду в Elder Scrolls: Oblivion.

Сьогодні існує два види шейдерів: вершинні та піксельні. Вершинні програми-шейдери можуть змінювати чи трансформувати 3D-об'єкти. Піксельні програми-шейдери дозволяють змінювати кольори пікселів на основі будь-яких даних. Уявіть собі джерело світла на 3D-сцені, яке змушує світитися об'єкти, що освітлюються, яскравіше, і в той же час, призводить до відкидання тіні на інші об'єкти. Все це реалізується за допомогою зміни інформації кольорів пікселів.

Піксельні шейдери використовуються для створення складних ефектів у ваших улюблених іграх. Наприклад, код шейдера може змусити пікселі, що оточують 3D-меч, яскравіше світитися. Ще один шейдер може обробити всі вершини складного 3D-об'єкта та симулювати вибух. Розробники ігор все частіше вдаються до допомоги складних програм-шейдерів для створення реалістичної графіки. Практично будь-яка гра з багатою графікою використовує шейдери.

З випуском наступного інтерфейсу прикладного програмування (API, Application Programming Interface) Microsoft DirectX 10 вийде третій тип шейдерів під назвою геометричні шейдери. З їхньою допомогою можна буде ламати об'єкти, модифікувати і навіть знищувати їх залежно від необхідного результату. Третій тип шейдерів можна буде точно так само програмувати, як і перші два, але роль його вже буде іншою.

Швидкість заповнення (Fill Rate)

Найчастіше на коробці з відеокартою можна зустріти значення швидкості заповнення. У принципі швидкість заповнення вказує на те, з якою швидкість графічний процесор може видавати пікселі. У старих відеокарт можна зустріти швидкість заповнення трикутників (triangle fill rate). Але сьогодні виділяють два типи швидкості заповнення: піксельну (pixel fill rate) та текстурну (texture fill rate). Як мовилося раніше, піксельна швидкість заповнення відповідає швидкості видачі пікселів. Вона розраховується як число растрових операцій (ROP), помножене тактову частоту.

Текстурну швидкість заповнення ATi та nVidia вважають по-різному. nVidia вважає, що швидкість виходить множенням числа піксельних конвеєрів на тактову частоту. А ATi збільшує кількість текстурних блоків на тактову частоту. В принципі, обидва способи коректні, оскільки nVidia використовує по одному текстурному блоку блок піксельних шейдерів (тобто по одному на піксельний конвеєр).

З урахуванням даних визначень дозвольте рушити далі і обговорити найважливіші функції графічного процесора, що роблять і чому вони такі значущі.

Архітектура графічного процесора: функції

Реалізм 3D-графіки дуже залежить від продуктивності відеокарти. Чим більше блоків піксельних шейдерів містить процесор і що вище частота, то більше ефектів можна накласти на 3D-сцену, щоб поліпшити її візуальне сприйняття.

Графічний процесор містить багато різних функціональних блоків. За кількістю деяких компонентів можна оцінити, наскільки потужний графічний процесор. Перед тим, як рухатися далі, дозвольте розглянути найважливіші функціональні блоки.

Вершинні процесори (блоки вершинних шейдерів)

Як і блоки піксельних шейдерів, вершинні процесори виконують код програм-шейдерів, які стосуються вершин. Оскільки більший бюджет вершин дозволяє створювати складніші 3D-об'єкти, продуктивність вершинних процесорів дуже важлива у 3D-сценах зі складними об'єктами або з великою їх кількістю. Втім, блоки вершинних шейдерів все ж таки не так очевидно впливають на продуктивність, як піксельні процесори.

Піксельні процесори (блоки піксельних шейдерів)

Піксельний процесор - це компонент графічного чіпа, виділений для обробки піксельних програм-шейдерів. Ці процесори виконують обчислення, що стосуються лише пікселів. Оскільки пікселі містять інформацію про колір, піксельні шейдери дозволяють досягти вражаючих графічних ефектів. Наприклад, більшість ефектів води, які ви бачили в іграх, створюється за допомогою піксельних шейдерів. Зазвичай число піксельних процесорів використовується порівняння піксельної продуктивності відеокарт. Якщо одна карта оснащена вісьмома блоками піксельних шейдерів, а інша - 16 блоками, то цілком логічно припустити, що відеокарта з 16 блоками швидше оброблятиме складні піксельні програми. Також слід враховувати і тактову частоту, але сьогодні подвоєння числа піксельних процесорів ефективніше з енергоспоживання, ніж подвоєння частоти графічного чіпа.

Уніфіковані шейдери

Уніфіковані (єдині) шейдери ще не прийшли у світ ПК, але майбутній стандарт DirectX 10 спирається на подібну архітектуру. Тобто структура коду вершинних, геометричних та піксельних програм буде єдиною, хоча шейдери виконуватимуть різну роботу. Нову специфікацію можна переглянути в Xbox 360, де графічний процесор був спеціально розроблений ATi для Microsoft. Буде цікаво побачити, який потенціал несе новий DirectX 10.

Блоки накладання текстур (Texture Mapping Unit, TMU)

Текстури слід вибрати та відфільтрувати. Ця робота виконується блоками накладання текстур, які працюють разом із блоками піксельних та вершинних шейдерів. Робота TMU полягає у застосуванні текстурних операцій над пікселями. Число текстурних блоків у графічному процесорі часто використовується для порівняння текстурної продуктивності відеокарт. Цілком розумно припустити, що відеокарта з більшим числом TMU дасть більш високу текстурну продуктивність.

Блоки растрових операцій (Raster Operator Unit, ROP)

Процесори растрових операцій відповідають за запис піксельних даних на згадку. Швидкість, з якою виконується ця операція є швидкістю заповнення (fill rate). У ранні дні 3D-прискорювачів число ROP та швидкість заповнення були дуже важливими характеристикамивідеокарт. Сьогодні робота ROP, як і раніше, важлива, але продуктивність відеокарти вже не впирається в ці блоки, як було раніше. Тому продуктивність (і число) ROP вже рідко використовується з метою оцінки швидкості відеокарти.

Конвеєри

Конвеєри використовуються для опису архітектури відеокарт і дають наочне уявлення про продуктивність графічного процесора.

Конвеєр не можна вважати строгим технічним терміном. У графічному процесорі використовуються різні конвеєри, які виконують функції, що відрізняються один від одного. Історично під конвеєром розуміли піксельний процесор, який був підключений до блоку накладання текстур (TMU). Наприклад, відеокарта Radeon 9700 використовується вісім піксельних процесорів, кожен з яких підключений до свого TMU, тому вважають, що у карти вісім конвеєрів.

Але сучасні процесори описати числом конвеєрів дуже складно. Порівняно з попередніми дизайнами, нові процесори використовують модульну, фрагментовану структуру. Новатором у цій сфері можна вважати ATi, яка з лінійкою відеокарт X1000 перейшла на модульну структуру, що дозволило досягти приросту продуктивності через внутрішню оптимізацію. Деякі блоки процесора використовуються більше, ніж інші, і підвищення продуктивності графічного процесора ATi постаралася знайти компроміс між числом потрібних блоків і площею кристала (її не можна дуже сильно збільшувати). У цій архітектурі термін «піксельний конвеєр» вже втратив своє значення, оскільки піксельні процесори не підключені до власних блоків TMU. Наприклад, графічний процесор ATi Radeon X1600 має 12 блоків піксельних шейдерів і всього чотири блоки накладання текстур TMU. Тому не можна говорити, що в архітектурі цього процесора є 12 піксельних конвеєрів, як і говорити, що їх лише чотири. Втім, за традицією, піксельні конвеєри все ще згадують.

З урахуванням допущень, число піксельних конвеєрів в графічному процесорі часто використовують для порівняння відеокарт (за винятком лінійки ATi X1x00). Наприклад, якщо взяти відеокарти з 24 та 16 конвеєрами, то цілком розумно припустити, що карта з 24 конвеєрами буде швидше.

Архітектура графічного процесора: технологія

Техпроцес

Під цим терміном розуміють розмір одного елемента (транзистора) чіпа та точність процесу виробництва. Удосконалення техпроцесів дозволяє одержати елементи менших розмірів. Наприклад, техпроцес 0,18 мкм дає елементи більшого розміру, ніж 0,13 мкм техпроцес, тому він не такий ефективний. Транзистори меншого розміру працюють від меншої напруги. У свою чергу, зниження напруги призводить до зменшення теплового опору, що дає зниження кількості тепла, що виділяється. Удосконалення техпроцесу дозволяє зменшити відстань між функціональними блоками чіпа, але в передачу даних потрібно менше часу. Скорочення відстаней, зниження напруги та інші поліпшення дозволяють досягати вищих тактових частот.

Дещо ускладнює розуміння те, що для позначення техпроцесу сьогодні використовують як мікрометри (мкм), так і нанометри (нм). Насправді все дуже просто: 1 нанометр дорівнює 0,001 мікрометра, тому 0,09-мкм і 90-нм техпроцеси - це те саме. Як зазначалося вище, менший техпроцес дозволяє отримати більш високі тактові частоти. Наприклад, якщо порівнювати відеокарти з чіпами 0,18 і 0,09 мкм (90 нм), то цілком розумно очікувати від 90-нм карти вищої частоти.

Тактова частота графічного процесора

Тактова частота графічного процесора вимірюється в мегагерцах (МГц), тобто у мільйонах тактів за секунду.

Тактова частота впливає на продуктивність графічного процесора. Чим вона вища, тим більше роботиможна виконати за секунду. Для першого прикладу візьмемо відеокарти nVidia GeForce 6600 та 6600 GT: графічний процесор 6600 GT працює на частоті 500 МГц, а у звичайної карти 6600 – на 400 МГц. Оскільки процесори технічно ідентичні, 20% приріст тактової частоти 6600 GT призводить до більш високої продуктивності.

Але тактова частота це ще далеко не все. Слід враховувати, що на продуктивність дуже впливає архітектура. Для другого прикладу візьмемо відеокарти GeForce 6600 GT та GeForce 6800 GT. Частота графічного процесора 6600 GT становить 500 МГц, але 6800 GT працює лише на 350 МГц. А тепер візьмемо до уваги, що 6800 GT використовують 16 піксельних конвеєрів, а 6600 GT — лише вісім. Тому 6800 GT з 16 конвеєрами на 350 МГц дасть приблизно таку ж продуктивність, як процесор із вісьмома конвеєрами та подвоєною тактовою частотою (700 МГц). З урахуванням сказаного, тактову частоту можна використовувати порівняння продуктивності.

Локальна відеопам'ять

Пам'ять відеокарти дуже впливає на продуктивність. Але різні параметри пам'яті впливають по-різному.

Об'єм відеопам'яті

Об'єм відеопам'яті, напевно, можна назвати параметром відеокарти, який найбільше переоцінюють. Недосвідчені споживачі часто використовують обсяг відеопам'яті для порівняння різних карт між собою, але насправді обсяг слабко впливає на продуктивність порівняно з такими параметрами, як частота шини пам'яті та інтерфейс (ширина шини).

У більшості випадків картка зі 128 Мбайт відеопам'яті буде працювати майже так само, як картка з 256 Мбайт. Звичайно, є ситуації, коли більший обсяг пам'яті призводить до збільшення продуктивності, але слід пам'ятати, що більший обсяг пам'яті не буде автоматично призводити до зростання швидкості в іграх.

Де обсяг буває корисним, то це в іграх з текстурами високої роздільної здатності. Ігрові розробники додають до гри кілька наборів текстур. І чим більше пам'яті буде на відеокарті, тим більша роздільна здатність можуть мати текстури, що завантажуються. Текстури високої роздільної здатності дають більш високу чіткість та деталізацію у грі. Тому цілком розумно брати карту з великим обсягом пам'яті, якщо всі інші критерії збігаються. Ще раз нагадаємо, що ширина шини пам'яті та її частота набагато сильніше впливають на продуктивність, ніж обсяг фізичної пам'яті на карті.

Ширина шини пам'яті

Ширина шини пам'яті - один із найважливіших аспектів продуктивності пам'яті. Сучасні шини мають ширину від 64 до 256 біт, а деяких випадках навіть 512 біт. Чим ширша шина пам'яті, тим більше інформації вона може передати за такт. А це безпосередньо впливає на продуктивність. Наприклад, якщо взяти дві шини з рівними частотами, теоретично 128-бітна шина передасть вдвічі більше даних за такт, ніж 64-бітна. А 256-бітна шина ще вдвічі більше.

Вища пропускна здатність шини (виражається в бітах або байтах за секунду, 1 байт = 8 біт) дає більш високу продуктивність пам'яті. Саме тому шина пам'яті набагато важливіша, ніж її об'єм. При рівних частотах 64-бітна шина пам'яті працює зі швидкістю лише 25% від 256-бітної!

Візьмемо такий приклад. Відеокарта зі 128 Мбайт відеопам'яті, але з 256-бітною шиною дає набагато більшу продуктивність пам'яті, ніж 512-Мбайт модель з 64-бітною шиною. Важливо, що деякі карти з лінійки ATi X1x00 виробники вказують специфікації внутрішньої шини пам'яті, але нас цікавлять параметри зовнішньої шини. Наприклад, у X1600 внутрішня кільцева шина має ширину 256 біт, але зовнішня – лише 128 біт. І насправді шина пам'яті працює зі 128-бітною продуктивністю.

Типи пам'яті

Пам'ять можна розділити на дві основні категорії: SDR (одиночна передача даних) і DDR (подвійна передача даних), коли дані передаються за такт вдвічі швидше. Сьогодні технологія одиночної передачі SDR застаріла. Оскільки у пам'яті DDR дані передаються вдвічі швидше, ніж у SDR, важливо пам'ятати, що відеокарти з пам'яттю DDR найчастіше вказують подвоєну частоту, а не фізичну. Наприклад, якщо у пам'яті DDR зазначена частота 1000 МГц, це ефективна частота, коли він має працювати звичайна пам'ять SDR, щоб дати таку ж пропускну здатність. Насправді ж фізична частота становить 500 МГц.

З цієї причини багато хто дивується, коли для пам'яті їх відеокарти вказана частота 1200 МГц DDR, а утиліти повідомляють про 600 МГц. Так що доведеться звикнути. Пам'ять DDR2 та GDDR3/GDDR4 працює за таким же принципом, тобто з подвійною передачею даних. Різниця між пам'яттю DDR, DDR2, GDDR3 та GDDR4 криється в технології виробництва та деяких деталях. DDR2 може працювати на більш високих частотах, ніж пам'ять DDR, а DDR3 — ще більш високих, ніж DDR2.

Частота шини пам'яті

Подібно до процесора, пам'ять (або, точніше, шина пам'яті) працює на певних тактових частотах, що вимірюються в мегагерцах. Тут підвищення тактових частот впливає на продуктивність пам'яті. І частота шини пам'яті є одним із параметрів, які використовують для порівняння продуктивності відеокарт. Наприклад, якщо всі інші характеристики (ширина шини пам'яті і т.д.) будуть однаковими, то цілком логічно стверджувати, що відеокарта з пам'яттю 700-МГц працює швидше, ніж з 500-МГц.

Знову ж таки, тактова частота — це ще не все. 700-МГц пам'ять з 64-бітною шиною працюватиме повільніше, ніж 400-МГц пам'ять зі 128-бітною шиною. Продуктивність 400-МГц пам'яті на 128-бітній шині відповідає приблизно 800-МГц пам'яті на 64-бітній шині. Слід також пам'ятати, що частоти графічного процесора і пам'яті — різні параметри, і зазвичай вони різняться.

Інтерфейс відеокарти

Всі дані, що передаються між відеокартою та процесором, проходять через інтерфейс відеокарти. Сьогодні для відеокарт використовується три типи інтерфейсів: PCI, AGP та PCI Express. Вони відрізняються пропускною спроможністю та іншими характеристиками. Зрозуміло, що вища пропускна спроможність, тим вища і швидкість обміну. Втім, високу пропускну здатність можуть використовувати лише найсучасніші карти, та й то лише частково. У якийсь момент швидкість інтерфейсу перестала бути «вузьким місцем», її сьогодні досить.

Найповільніша шина, для якої випускалися відеокарти, це PCI (Peripheral Components Interconnect). Якщо не вдаватися в історію, звісно. PCI справді погіршувала продуктивність відеокарт, тому вони перейшли на інтерфейс AGP (Accelerated Graphics Port). Але навіть специфікації AGP 1.0 та 2x обмежували продуктивність. Коли стандарт збільшив швидкість до рівня AGP 4x, ми почали наближатися до практичної межі пропускної здатності, яку можуть використовувати відеокарти. Специфікація AGP 8x ще раз подвоїла пропускну спроможність порівняно з AGP 4x (2,16 Гбайт/с), але відчутного приросту графічної продуктивності ми вже не отримали.

Найновіша і швидкісна шина - PCI Express. Нові графічні карти зазвичай використовують інтерфейс PCI Express x16, який поєднує 16 ліній PCI Express, що дають сумарну пропускну спроможність 4 Гбайт/с (в одному напрямку). Це вдвічі більше, ніж пропускна спроможність AGP 8x. Шина PCI Express дає згадану пропускну здатність для обох напрямків (передача даних на відеокарту та з неї). Але швидкості стандарту AGP 8x було достатньо, тому ми поки що не зустрічали ситуації, коли перехід на PCI Express дав приріст продуктивності проти AGP 8x (якщо інші апаратні параметри однакові). Наприклад, AGP-версія GeForce 6800 Ultra працюватиме ідентично 6800 Ultra для PCI Express.

Сьогодні найкраще купувати картку з інтерфейсом PCI Express, він протримається на ринку ще кілька років. Найбільш продуктивні карти вже не випускаються з інтерфейсом AGP 8x, і рішення PCI Express, як правило, знайти вже легше за аналоги AGP, та й коштують вони дешевше.

Рішення на кількох відеокартах

Використовувати кілька відеокарт для збільшення графічної продуктивності – ідея не нова. У ранні дні 3D-графіки копання 3dfx вийшла на ринок із двома відеокартами, що працюють паралельно. Але зі зникненням 3dfx технологія спільної роботи кількох споживчих відеокарт була забута, хоча ATi випускала подібні системи для професійних симуляторів ще з виходу Radeon 9700. Кілька років тому технологія повернулася на ринок: з появою рішень nVidia SLI і, трохи пізніше, ATi Cros

Спільне використання кількох відеокарт дає достатню продуктивність, щоб вивести гру з високими налаштуваннями якості високої роздільної здатності. Але вибирати те чи інше рішення не так просто.

Почнемо з того, що рішення на основі кількох відеокарт вимагають велика кількістьенергії, тому блок живлення має бути досить потужним. Все це тепло доведеться відводити від відеокарти, тому потрібно звернути увагу на корпус ПК та охолодження, щоб система не перегрілася.

Крім того, пам'ятайте, що SLI/CrossFire вимагає відповідної материнської плати (під одну технологію, або під іншу), яка зазвичай коштує дорожче в порівнянні зі стандартними моделями. Конфігурація nVidia SLI працюватиме лише на певних платах nForce4, а карти ATi CrossFire – лише на материнських платахіз чіпсетом CrossFire або на деяких моделях Intel. Ситуацію ускладнює і те, що деякі конфігурації CrossFire вимагають, щоб одна з карток була спеціальною: CrossFire Edition. Після виходу CrossFire для деяких моделей відеокарт ATi дозволила включати технологію спільної роботи з шині PCI Express, причому з виходами нових версій драйверів кількість можливих комбінацій зростає. Але все ж таки апаратний CrossFire з відповідною картою CrossFire Edition дає більш високу продуктивність. Але і карти CrossFire Edition коштують дорожче за звичайні моделі. На даний момент ви можете увімкнути програмний режим CrossFire (без картки CrossFire Edition) на відеокартах Radeon X1300, X1600 та X1800 GTO.

Слід враховувати інші чинники. Хоча дві графічні карти, що працюють спільно, і дають приріст продуктивності, йому далеко до дворазового. Але грошей ви віддасте вдвічі більше. Найчастіше приріст продуктивності становить 20-60%. А в деяких випадках через додаткові обчислювальні витрати на узгодження приросту немає взагалі. Тому конфігурації на декількох картах навряд чи виправдовують себе з дешевими моделями, оскільки більш дорога відеокарта, як правило, завжди обганяє пару дешевих карт. Загалом, більшість споживачів брати рішення SLI/CrossFire сенсу немає. Але якщо ви хочете включити всі опції покращення якості або грати в екстремальних дозволах, наприклад, 2560×1600, коли треба прораховувати більше 4 мільйонів пікселів на кадр, то без двох або чотирьох спарених відеокарт не обійтися.

Візуальні функції

Крім чисто апаратних специфікацій, різні покоління та моделі графічних процесорів можуть відрізнятися набором функцій. Наприклад, часто говорять про те, що карти покоління ATi Radeon X800 XT сумісні з Shader Model 2.0b (SM), тоді як nVidia GeForce 6800 Ultra сумісна з SM 3.0, хоча їх апаратні специфікації близькі одна до одної (16 конвеєрів). Тому багато споживачів роблять вибір на користь того чи іншого рішення, навіть не знаючи, що означає ця відмінність.

Microsoft DirectX та версії Shader Model

Ці назви найчастіше використовують у суперечках, але мало хто знає, що вони означають насправді. Щоб розібратися, почнемо з історії графічних API. DirectX і OpenGL – це графічні API, тобто інтерфейси прикладного програмування (Application Programming Interface) – відкриті стандарти коду, доступні кожному.

До появи графічних API кожен виробник графічних процесорів використовував власний механізм спілкування з іграми. Розробникам доводилося писати окремий код кожному за графічного процесора, який вони хотіли підтримати. Дуже дорогий і ефективний підхід. Для вирішення цієї проблеми було розроблено API для 3D-графіки, щоб розробники писали код під конкретний API, а не під ту чи іншу відеокарту. Після цього проблеми сумісності лягли вже на плечі виробників відеокарт, яким довелося гарантувати, що драйвери будуть сумісні з API.

Єдиною складністю залишається те, що сьогодні використовуються два різні API, а саме Microsoft DirectX та OpenGL, де GL розшифровується як Graphics Library (графічна бібліотека). Оскільки API DirectX сьогодні в іграх популярніший, ми сконцентруємося саме на ньому. Та й на розвиток ігор цей стандарт вплинув сильніше.

DirectX - це створення Microsoft. Насправді, в DirectX входить кілька API, лише один із яких використовується для 3D-графіки. DirectX включає API для звуку, музики, пристроїв введення тощо. За 3D-графіку в DirectX відповідає API Direct3D. Коли говорять про відеокарти, то мають на увазі саме його, тому в цьому відношенні поняття DirectX та Direct3D взаємозамінні.

DirectX періодично оновлюється в міру того, як графічні технології просуваються вперед, а ігрові розробники впроваджують нові методи програмування ігор. Оскільки популярність DirectX швидко зросла, виробники графічних процесорів почали наздоганяти випуск нових продуктів під можливості DirectX. Тому відеокарти часто прив'язують до апаратної підтримки того чи іншого покоління DirectX (DirectX 8, 9.0 або 9.0c).

Ситуацію ускладнює і те, що частини API Direct3D можуть змінюватися з часом без зміни поколінь DirectX. Наприклад, специфікація DirectX 9.0 містить підтримку Pixel Shader 2.0. Але оновлення DirectX 9.0c включає Pixel Shader 3.0. Таким чином, хоча карти відносяться до класу DirectX 9, вони можуть підтримувати різні набори функцій. Наприклад, Radeon 9700 підтримує Shader Model 2.0, а Radeon X1800 - Shader Model 3.0, хоча обидві карти можна зарахувати до покоління DirectX 9.

Пам'ятайте, що при створенні нових ігор розробники враховують власників старих машин та відеокарт, оскільки якщо ігнорувати цей сегмент користувачів, то рівень продажів буде нижчим. Тому в ігри вбудовується кілька шляхів коду. У гри класу DirectX 9, напевно, є для сумісності шлях DirectX 8 і навіть шлях DirectX 7. Зазвичай, якщо вибирається старий шлях, то в грі зникають деякі віртуальні ефекти, які є на нових відеокартах. Але принаймні можна грати навіть на старому «залізі».

Багато нових ігор вимагають встановлення новітньої версії DirectX, навіть якщо відеокарта належить до попереднього покоління. Тобто нова гра, яка використовуватиме шлях DirectX 8, все одно вимагає встановлення новітньої версії DirectX 9 для відеокарти класу DirectX 8.

Які ж відмінності між різними версіями API Direct3D у DirectX? Ранні версії DirectX – 3, 5, 6 та 7 – були відносно прості за можливостями API Direct3D. Розробники могли вибирати візуальні ефекти зі списку, після чого перевіряти їхню роботу у грі. Наступним важливим кроком у програмуванні графіки став DirectX 8. У ньому з'явилася можливість програмувати відеокарту за допомогою шейдерів, тому розробники вперше здобули свободу програмувати ефекти так, як їм потрібно. DirectX 8 підтримував версії Pixel Shader від 1.0 до 1.3 та Vertex Shader 1.0. DirectX 8.1, оновлена версія DirectX 8, отримала Pixel Shader 1.4 та Vertex Shader 1.1.

У DirectX 9 можна створювати ще складніші програми-шейдери. DirectX 9 підтримує Pixel Shader 2.0 та Vertex Shader 2.0. DirectX 9c, оновлена версія DirectX 9, увімкнула специфікацію Pixel Shader 3.0.

DirectX 10, майбутня версія API, буде супроводжувати нову версію Windows Vista. На Windows XP встановити DirectX 10 не вдасться.

HDR-освітлення та OpenEXR HDR

HDR розшифровується як "High Dynamic Range", високий динамічний діапазон. Гра з HDR-освітленням може дати набагато більш реалістичну картинку, ніж гра без такого, причому не всі відеокарти підтримують HDR-освітлення.

Перед появою відеокарт класу DirectX 9 графічні процесори були серйозно обмежені точністю обчислень освітлення. До цього часу освітлення можна було розраховувати лише з 256 (8 біт) внутрішніми рівнями.

Коли з'явилися відеокарти класу DirectX 9, вони отримали можливість видавати освітлення з високою точністю – повні 24 біти або 16,7 млн рівнів.

З 16,7 млн. рівнів і після того, як було зроблено наступний крок по продуктивності відеокарт класу DirectX 9/Shader Model 2.0, на комп'ютерах стало можливим і HDR-освітлення. Це досить складна технологія і дивитися її потрібно в динаміці. Якщо казати простими словами, то HDR-освітлення збільшує контрастність (темні відтінки виглядають темнішими, світліші - світлішими), в той же час підвищуючи кількість деталей освітлення на темних і світлих областях. Гра з HDR-освітленням здається більш живою та реалістичною, ніж без неї.

Графічні процесори, що відповідають останнім специфікаціям Pixel Shader 3.0, дозволяють розраховувати освітлення з вищою 32-бітною точністю, а також виконувати змішання (blending) з плаваючою комою. Таким чином, відеокарти класу SM 3.0 можуть підтримувати спеціальний метод HDR-освітлення OpenEXR спеціально розроблений для кіноіндустрії.

Деякі ігри, які підтримують лише HDR-освітлення методом OpenEXR, не підуть із HDR-освітленням на відеокартах Shader Model 2.0. Втім, ігри, які не спираються на метод OpenEXR, працюватимуть на будь-якій відеокарті DirectX 9. Наприклад, Oblivion використовує метод OpenEXR HDR і дозволяє включати HDR-освітлення лише на новітніх відеокартах, які підтримують специфікацію Shader Model 3.0. Наприклад, nVidia GeForce 6800 чи ATi Radeon X1800. Ігри, які використовують 3D-движок Half-Life 2, та сама Counter-Strike: Source і майбутня Half-Life 2: Aftermath, дозволяють включати HDR-рендеринг на старих відеокартах DirectX 9, які підтримують тільки Pixel Shader 2.0. Як приклади можна навести лінійку GeForce 5 або ATi Radeon 9500.

Нарешті, слід враховувати, що всі форми HDR-рендерінгу вимагають серйозної обчислювальної потужності і можуть навіть найпотужніші графічні процесори «на коліна». Якщо ви хочете грати в новітні ігриз HDR-освітленням, то без високопродуктивної графіки не обійтися.

Повноекранне згладжування

Повноекранне згладжування (скорочено AA) дозволяє усунути характерні «драбинки» на межах полігонів. Але слід враховувати, що повноекранне згладжування споживає чимало обчислювальних ресурсівщо призводить до падіння частоти кадрів.

Згладжування дуже залежить від продуктивності відеопам'яті, тому швидкісна відеокарта зі швидкою пам'яттю зможе прорахувати повноекранне згладжування з меншою шкодою для продуктивності, ніж недорога відеокарта. Згладжування можна включати у різних режимах. Наприклад, згладжування 4x дасть якіснішу картинку, ніж згладжування 2x, але це буде великим ударом по продуктивності. Якщо згладжування 2x подвоює горизонтальну та вертикальну роздільну здатність, режим 4x його вчетвержує.

Текстурна фільтрація

На всі 3D-об'єкти в грі накладаються текстури, причому чим більше кут поверхні, що відображається, тим більш спотвореною буде виглядати текстура. Щоб усунути цей ефект, графічні процесори використовують фільтрацію текстури.

Перший спосіб фільтрації називався білінійним і давав характерні смужки, які були не дуже приємні для ока. Ситуація покращилася з використанням трилінійної фільтрації. Обидві опції на сучасних відеокартах працюють практично без шкоди продуктивності.

На сьогодні найбільш найкращим способомФільтрування текстур є анізотропна фільтрація (AF). Подібно до повноекранного згладжування, анізотропну фільтрацію можна включати на різних рівнях. Наприклад, 8x AF дає більш високу якість фільтрації, ніж 4x AF. Як і повноекранне згладжування, анізотропна фільтрація вимагає певної обчислювальної потужності, яка збільшується з підвищенням рівня AF.

Текстури високої роздільної здатності

Всі 3D-ігри створюються з урахуванням конкретних специфікацій, і одна з таких вимог визначає текстурну пам'ять, яка знадобиться грі. Всі потрібні текстури повинні вміщатися в пам'ять відеокарти під час гри, інакше продуктивність сильно падатиме, оскільки звернення за текстурою в оперативну пам'ятьдає чималу затримку, не кажучи вже про файл підкачування на жорсткому диску. Тому, якщо розробник гри розраховує на 128 Мбайт відеопам'яті як мінімальна вимогаНабір активних текстур не повинен перевищувати 128 Мбайт у будь-який час.

Сучасні ігри мають кілька наборів текстур, так що гра без проблем працюватиме на старих відеокартах з меншою кількістю відеопам'яті, а також і на нових картах з великим об'ємом відеопам'яті. Наприклад, гра може містити три набори текстур: для 128 Мбайт, 256 Мбайт та 512 Мбайт. Ігор, які підтримують 512 Мбайт відеопам'яті, сьогодні дуже мало, але вони все ж таки є найоб'єктивнішою причиною для покупки відеокарти з таким обсягом пам'яті. Хоча збільшення обсягу пам'яті практично не позначається на продуктивності, ви отримаєте покращення візуальної якості, якщо гра підтримує набір текстур.

Що потрібно знати про відеокарти?

Вконтакте

Мабуть, зараз ці блоки – головні частини відеочіпа. Вони виконують спеціальні програми відомі як шейдери. Причому, якщо раніше піксельні шейдери виконували блоки піксельних шейдерів, а вершинні - вершинні блоки, то з деякого часу графічні архітектури були уніфіковані, і ці універсальні обчислювальні блоки займалися різними розрахунками: вершинними, піксельними, геометричними і навіть універсальними обчисленнями.

Вперше уніфікована архітектура була застосована у відеочіпі ігрової консолі Microsoft Xbox 360 цей графічний процесор був розроблений компанією ATI (згодом купленої AMD). А у відеочіпах для персональних комп'ютерівуніфіковані шейдерні блоки з'явилися ще в платі NVIDIA GeForce 8800. І з тих пір все нові відеочіпи засновані на уніфікованій архітектурі, яка має універсальний код для різних шейдерних програм (вершинних, піксельних, геометричних та ін.), і відповідні уніфіковані процесори можуть виконати будь-які .

За кількістю обчислювальних блоків та їх частоті можна порівнювати математичну продуктивність різних відеокарт. Більшість ігор зараз обмежена продуктивністю виконання піксельних шейдерів, тому кількість цих блоків дуже важлива. Наприклад, якщо одна модель відеокарти заснована на GPU з 384 обчислювальними процесорами в його складі, а інша з тієї ж лінійки має GPU зі 192 обчислювальними блоками, то при рівній частоті друга буде вдвічі повільніше обробляти будь-який тип шейдерів, і в цілому буде настільки ж продуктивніше.

Хоча, виключно на підставі однієї кількості обчислювальних блоків робити однозначні висновки про продуктивність не можна, обов'язково потрібно врахувати і тактову частоту і різну архітектуру блоків різних поколінь і виробників чіпів. Тільки за цими цифрами можна порівнювати чіпи лише в межах однієї лінійки одного виробника: AMD чи NVIDIA. В інших випадках слід звертати увагу на тести продуктивності в цікавих іграх або додатках.

Блоки текстурування (TMU)

Ці блоки GPU працюють спільно з обчислювальними процесорами, ними здійснюється вибірка та фільтрація текстурних та інших даних, необхідних для побудови сцени та універсальних обчислень. Число текстурних блоків у відеочіпі визначає текстурну продуктивність – тобто швидкість вибірки текселів із текстур.

Хоча останнім часом більший акцент робиться на математичні розрахунки, а частина текстур замінюється процедурними, навантаження на блоки TMU і зараз досить велика, оскільки крім основних текстур, вибірки необхідно робити і з карт нормалей та зсувів, а також позаекранних буферів рендерингу render target.

З урахуванням упору багатьох ігор у тому числі й у продуктивність блоків текстурування, можна сказати, що кількість блоків TMU та відповідна висока текстурна продуктивність також є одними з найважливіших параметрівдля відеочіпів. Особливий вплив цей параметр надає швидкість рендерингу картинки при використанні анізотропної фільтрації, що вимагають додаткових текстурних вибірок, а також складних алгоритмів м'яких тіней і новомодних алгоритмів на кшталт Screen Space Ambient Occlusion.

Блоки операцій растеризації (ROP)

Блоки розтеризації здійснюють операції запису розрахованих відеокартою пікселів у буфери та операції їх змішування (блендінгу). Як ми вже зазначали вище, продуктивність блоків ROP впливає на філлрейт і це одна з основних характеристик відеокарт всіх часів. І хоча останнім часом її значення також трохи знизилося, все ще трапляються випадки, коли продуктивність програм залежить від швидкості та кількості блоків ROP. Найчастіше це пояснюється активним використанням фільтрів постобробки та включеним антиаліасингом при високих ігрових налаштуваннях.

Архітектура графічного процесора: функції

Вершинні процесори (блоки вершинних шейдерів)

Піксельні процесори (блоки піксельних шейдерів)

Уніфіковані шейдери

Блоки накладання текстур (Texture Mapping Unit, TMU)

Блоки растрових операцій (Raster Operator Unit, ROP)

Процесори растрових операцій відповідають за запис піксельних даних на згадку. Швидкість, з якою виконується ця операція є швидкістю заповнення (fill rate). У ранні дні 3D-прискорювачів число ROP та швидкість заповнення були дуже важливими характеристиками відеокарт. Сьогодні робота ROP, як і раніше, важлива, але продуктивність відеокарти вже не впирається в ці блоки, як було раніше. Тому продуктивність (і число) ROP вже рідко використовується з метою оцінки швидкості відеокарти.

Конвеєри

Але сучасні процесори описати числом конвеєрів дуже складно. Порівняно з попередніми дизайнами, нові процесори використовують модульну, фрагментовану структуру. Новатором у цій сфері можна вважати ATi, яка з лінійкою відеокарт X1000 перейшла на модульну структуру, що дозволило досягти приросту продуктивності через внутрішню оптимізацію. Деякі блоки процесора використовуються більше, ніж інші, і підвищення продуктивності графічного процесора ATi постаралася знайти компроміс між числом потрібних блоків і площею кристала (її не можна дуже сильно збільшувати). У цій архітектурі термін "піксельний конвеєр" вже втратив своє значення, оскільки піксельні процесори вже не підключені до власних блоків TMU. Наприклад, графічний процесор ATi Radeon X1600 має 12 блоків піксельних шейдерів і всього чотири блоки накладання текстур TMU. Тому не можна говорити, що в архітектурі цього процесора є 12 піксельних конвеєрів, як і говорити, що їх лише чотири. Втім, за традицією, піксельні конвеєри все ще згадують.

ЗМІСТ

Про що розповідатиметься у цій невеликій статті?

Ця стаття – набір базових знань для тих, хто хоче вибрати збалансовану відеокарту, не віддаючи зайвих грошей маркетологам. Допоможе новачкам, а також послужить джерелом корисної інформації і для більш просунутих користувачів ПК. Тим не менш, міні стаття все ж таки, орієнтована саме на новачків.

Призначення відеокарти.

Ні для кого не секрет, що в наш час основним полем діяльності для продуктивної відеокарти є – 3 Dігри, плавне програвання відео( HD ), робота у професійних 3D2Dта відео редакторах. Інші повсякденні завдання можна без проблем виконувати і на вбудованих в процесор або чіпсет відеокартах. З недавнього часу для відеокарти розширили поле діяльності у вигляді багатопоточних обчислень, які працюють набагато швидше на паралельній архітектурі відеокарт, ніж процесорах.

NVidiaпросуває свою програмно-апаратну платформуCUDA, засновану на мовіСі (Між іншим вдало, і це не дивно, при вкладанні таких засобів).AMDж, в основному покладається на відкритий кодOpenCL.

За допомогою можна кодувати відео в 3-4 рази швидше. Апаратно, силами відеокарт прискорювати продукти компаніїAdobe- зокрема Photoshop, Flash, і це очевидно тільки початок. Щоправда, тих людей, які постійно користуються обчислювальною потужністювідеокарт, теоретично дуже мало. І здавалося замислюватися про це поки що рано, тим більше на п'яти наступають багатоядерні процесори, які хоч і повільніші в багатопотокових операціях, але мають незаперечний плюс у тому, що вони без складних програмних оптимізацій просто роблять свою справу. А простота та зручність реалізації, як показує історіяWindows(наприклад) – для людей головне та запорука успіху на Software ринку. І все одно варто віддати данину обчислювальної потужності відеокарт, поки не приборканої «правильним» софтом.

Отже. NVidiaабоAMD?

*Найцікавіше питання

Головними гравцями на ринку графічних прискорювачів є корпораціїAMDі NVidia.

Тут все зрозуміло, як і в багатьох секторах ринків,дуополія. Як Pepsiі Coca - Cola, як і Xbox 360 , як Intelі AMDв кінці кінців. З недавнього часу компанії випускають свої продукти по черзі. Щоб і одній було добре і другий. Спочатку AMDвипускає флагмана лінійки, потім через два-три місяці, більш потужного флагмана випускає NVidia. Спочатку купуються карти від AMD, як найпотужніші, потім після виходу карток NVidia, що купили їх, знову йдуть до магазину, за ще найкращим продуктом. Практично те саме відбувається і з середнім та бюджетним ринком. Тільки розкид за збільшеною продуктивністю щодо конкурента тут вищий, тому що щоб зацікавити більш економного споживача, потрібно щось більше, ніж шанс мати кращу відеокарту, як це відбувається в секторі флагманів.

Краще не фанатіти, адже це бізнес і нічого особистого. Головне, щоб відеокарти були продуктивними, а ціни не кусалися. І який виробник — не має значення. З таким підходом можна завжди залишатися у виграші за продуктивністю.

Архітектура чіпа.

Кількістьпіксельних процесорів (для AMD ), універсальних конвеєрів (для NVidia).

Так. Це зовсім різні речі. Те, що у AMD Radeon HD 5870 – 1600 виконавчих блоків зовсім не означає, що вона буде втричі потужніша, ніжNVidia GTX 480 у якої на борту є 480 Виконавчих блоків.

NVidiaмає скалярнуархітектуру, аAMD– супер скалярну .

AMD архітектури.

Розглянемо архітектуру ПП (*піксельних процесорів),на прикладі базової супер скалярної архітектури відеокартRadeon HD 5 серії ( 5-way VLIW).

Кожен 5 ппстановлять один виконавчий блок, який за один раз може виконати максимум. 1 скалярнуоперацію та 1 векторнуабо іноді 5 скалярних(проте умови не завжди підходять для цього). Кожна векторна операція вимагає 4 ПП, кожна скалярна 1 ПП. І тут, як уже вийде. УNVidiaа кожне Cuda Core, виконує строго по 1 векторноїі 1 скалярноїоперації за такт.

З виходом 6 серії, під кодовим ім'ям ( Nothern Islands ), а саме чіпів Cayman, вирішили відмовитися від додаткового, п'ятогоALU(T-unit), який відповідав за виконання складних завдань.

Тепер цю роль можуть виконувати три з чотирьох блоків, що залишилися. Це дозволило розвантажити диспетчер потоків ( Ultra-Threaded Dispatch Processor), яких на додачу стало вдвічі більше для покращення роботи з геометрією та тесселяцією, які були слабкою стороною 5 серії. Плюс до всього, дозволяє заощадити на площі ядра та транзисторному бюджеті за тієї ж ефективності.

Після шостої серії, робота у напрямку розвитку VLIWзакінчилася, зважаючи на її слабку гнучкість і великий час простою через залежностей внутрішніх блоків друг від друга (особливо векторні операції). На перший план вийшла нова архітектура Graphics Core Next .

Двигун SIMD, змінюється обчислювальним блоком Compute Unit (CU), що дозволяє значно підняти рівень ефективності та продуктивності архітектури. Кожен ПП тепер може незалежно виконувати векторні та скалярні операції, так як для них ввели роздільні блоки управління, які більш ефективно розподіляють ресурси між вільними блоками. В цілому, архітектура починає знаходити деякі передумови скалярної архітектури від NVidia, яка відрізняється простотою та ефективністю.

Першим чіпом із новою архітектурою став GPU Tahiti, на якому будуються AMD Radeon HD 7970/7950 . Компанія планує випустити середній клас на новій архітектурі.

Тепер розглянемо базову, скалярну архітектуру NVidia .

Як бачимо, кожен універсальний процесор ( ), за такт виконує 1 скалярну операцію та 1 вектор. Це дозволяє досягти максимальної плавності. Там де багато векторних та скалярних операцій, відеокартиAMDз архітектурою VLIWпоступаються, тому що вони не здатні завантажити роботою свої блоки як відеокартиNVidia.

Допустимо вибір упав міжRadeon HD 5870 і GeForce GTX 480 .

У першій 1600ппу другій 480 уніфікованих блоків.

Обчислюємо: 16005 = 320 суперскалярних блоків, у Radeon HD 5870

Тобто за такт відеокарта відAMD, виконує від 320 до 1600скалярних операцій та від 0 до 320 плаваючі векторні, залежно від характеру завдання.

А при подвоєній частоті шейдерного домену карта на архітектуріFermi, теоретично має виконувати 960 векторних та 960 скалярних операцій за такт.

Однак Radeon , має більш вигідну частоту, ніж карта із «зеленого табору» (700 проти 850). Отже, такі показникиNVidia, теоретично повинні бути як за частоти роботи шейдерного домену на частоті 1700мгц (850 x 2 = 1700), але це негаразд. При частоті 1401 МГц, GTX 480 видає ~ 700 векторних і ~ 700 скалярних операцій за такт.

* Не варто покладатися на достовірність даних обчислень, вони мають лише теоретичний характер. До того ж це твердження не діє з 6-ї серії Radeon, починаючи з чіпів Cayman.

За рахунок того, що максимальна кількістьвекторних та скалярних операцій виконується однакова кількість, архітектураNVidiaмає найкращу плавністьу складних сценах, ніж AMD VLIW (<5 series).

Цінові категорії та що ми отримуємо, якщо купуємо відеокарту серією молодшою.

Інженери AMD, не замислюючись ріжуть половину піксельних процесорів, шину пам'яті та частинуROP’ s поколінню карт, із сегмента на клас нижче. НаприкладRadeon HD5870 має 1600пп, шину 256 bit, а в 577 0, всього цього залишилося рівно половина - 800 , та шина пам'яті 128 bit. Така ж ситуація триває і до бюджетних відеокарт. Отже, завжди краще буде придбати більш слабку відеокарту з 58** серії, ніж найстаршу із серії 57**.

В інженерів NVidia, не багато іншого підходу. Плавно, обрізається шина пам'яті, універсальні конвеєри,ROP’ s , піксельні конвеєри. Але так само і знижуються частоти, які при належній системі охолодження можна трохи компенсувати розгоном. Трохи дивно, що не навпаки, як це робитьAMDпідвищуючи частоти на картах з обрізаною кількістю виконавчих елементів.

Підхід AMDбільш вигідний виробнику, підхід NVidia- покупцю.

Згадка про драйвери.

Саме через особливості суперскалярної архітектури VLIW, драйвера від AMD, Доводиться постійно оптимізувати, щоб відеокарта розуміла, коли їй потрібно використовувати вектори або скаляри максимально ефективно.

Уніфіковані драйвера відNVidiaбільш несприйнятливі до різних двигунів ігор, завдяки тому, що інженериNVidiaнайчастіше вже під час розробки гри оптимізують її під архітектуру своїх відео чипів та драйверів. Також варто відзначити, що при їх встановленні та видаленні не виникає практично жодних проблем, які притаманні драйверам відAMD.

Драйвера NVidiaможна встановлювати прямо на старі, без видалення та без чисток реєстру. Сподіваємося, що програмістиAMDрухатимуться в тому ж напрямку. З'явилася можливість скачувати «фікси» для драйверівCatalyst, які виходять незадовго до появи гри у продажу чи трохи згодом. Вже щось. А з виходом нової архітектури Graphics Core Next, робота з оптимізації драйверів значно полегшиться

Піксельні конвеєри, TMU, ROP.

Також, дуже важлива кількість піксельних конвеєріві TMU (блок накладання текстури), їх кількість особливо важлива при високих дозволах та при використанні анізотропної фільтрації текстур ( важливі піксельні конвеєри), використання високої якості текстур та високих налаштувань анізотропної фільтрації (важливі TMU).

Кількість блоківROP (блоки растрових операцій ), в основному впливають на продуктивність згладжування, але за їх недоліку може бути втрата загальної продуктивності. Чим їх більше, тим непомітніше впливатиме згладжування на кількість кадрів за секунду. Також, на продуктивність згладжування, істотно впливає обсяг відеопам'яті.

Об'єм, частота та розрядність шини пам'яті.

Чим більше відеопам'яті у відеокарти, тим краще. Однак не варто купуватися на великий обсяг.

Як часто буває, на відносно слабкі відеокарти ставлять неймовірні об'єми відеопам'яті, та ще й повільної (наприклад наGeForce 8500 GT, деякі OEMвиробники ставлять за 2 Гб DDR2 відеопам'яті). Від цього відеокарта не злетить і продуктивності не додасться.

* у порівнянні з 8500 GT 512 мб

Набагато найкращим варіантом буде взяти відеокарту з більш швидкою пам'яттю, але меншим об'ємом. Наприклад, якщо вибір стоїть: взяти 9800 GTз 512 або 1024 мбпам'яті, із частотою 1000мгці 900мгцвідповідно, то краще буде взяти 9800 GT з 512 мбпам'яті. Тим більше відеокарта такого рівня не потребує відеопам'яті більше, ніж 512 мб.

Пропускна спроможність пам'яті - Це головне у продуктивності підсистеми відеопам'яті, яка найважливішим чином впливає на продуктивність відеокарти в цілому. Вимірюється в Гб/c (гігабайт за секунду).

Наприклад зараз, активно використовується відеопам'ять типуGDDR5 , у якої набагато вищий частотний потенціал, ніж уGDDR3 , і відповідно біліша висока пропускна здатність.

Проте частота це далеко ще не все. Другим важливим фактором, є розрядність шини пам'яті. Чим вища розрядність, тим швидше пам'ять.

Наприклад, пам'ять із частотою 1000мгцта шиною 256 bit, буде рівно в 2 рази швидшепам'яті 1000мгцта шиною 128 bit. Чим більша розрядність — тим швидше пам'ять. Найширша шина пам'яті з існуючих – це монструозна 896 bit(448 x2 ) на відеокарті GeForce GTX295 . Однак у ній використовується пам'ятьGDDR3 , що суттєво погіршує пропускну здатність (менш ефективна частота) у порівнянні зGDDR5 . Тому, її пропускна здатність, навіть трохи нижче, ніж уRadeon HD 5970 з 512 bit(256 x 2), але з GDDR5 .

Система охолодження.

Чим ефективніша система охолодження, тим менший шанс, що ваша відеокарта вийде з ладу. Карта буде менше перегріватись, що покращить загальну стабільність системи, значно збільшить строк служби, а також підвищить розгінний потенціал.

Виготовлені, готовізістеми прохолодження відеокарт бувають двох варіацій.

Референсні (від виробника) та альтернативні (Від партнерів виробника). Як правило, референсні карти мають турбінне (, blower) виконання, і зазвичай дуже надійні. Відносно галасливі, не завжди такі ефективні, як альтернативні СОвід партнерів виробника та сильніше забиваються пилом. Хоча при використанні бловерні системи охолодження відеокарт дуже ефективні і тихі. Якщо невеликий шум при навантаженні вас не турбує, і ви не ставитимете рекордів у розгоні, референсні системи охолодження - краще. Зазвичай, партнери виробників, обклеюють їх наклейками зі своїми логотипами, зміни можливі лише в BIOS-е відеокарти (регулювання обертів вентилятора), тому деякі карти ідентичні по дизайну, але від різних виробників, гучніше або гарячіше своїх побратимів і навпаки. У кожного з виробників, свої переваги та гарантійні умови. Тому деякі жертвують тишею для більшої стабільності та довговічності.

Якщо ж вам важлива тиша, то варто звернути увагу на альтернативні системиохолодження підвищеної ефективності, з меншим рівнем шуму (наприкладVapor - x, IceQ, , DirectCu), або вибрати відеокарту з пасивною системою охолодження, яких сьогодні все більше.

* Порада: не забувайте раз на рік-два, змінювати термоінтерфейс, особливо на З з технологією прямого контакту теплових трубок. Термопаста застигає, утворюючи шар, що погано проводить тепло, що веде до перегріву відеокарти.

Енергоспоживання відеокарти.

Дуже важлива характеристика при виборі, так як відеокарта є дуже ненажерливим компонентом комп'ютера, якщо не ненажерливим. Топові відеокарти іноді наближаються до позначки 300W. Тому при виборі слід враховувати, чи здатний ваш блок живлення забезпечити відеокарті стабільне живлення. Інакше система може або не запуститися через невідповідність напруги під час проходження POST, можуть виникнути нестабільності в роботі та несподівані вимикання, перезавантаження або перегрів компонентів комп'ютера, або блок живлення може просто згоріти.

На сайті виробника або коробці відеокарти написані мінімальні характеристики, серед яких мінімальна потужність блоку живлення. Ці значення написані для будь-яких блоків, у тому числі китайських. Якщо ви впевнені, що у вас якісний блок живлення, можна відібрати від цього значення 50-100W.

Побічно визначити енергоспоживання можна за кількістю додаткових роз'ємів для живлення відеокарти.

Жодного – менше 75W, один 6-pin до 150W, два 6-pin до 225W, 8-pin + 6-pin - До 300W. Переконайтеся, що ваш блок має необхідні роз'єми або щоб у комплекті були перехідники під 4-х штиркові molex-и. Або докупіть їх, вони вільно продаються у комп'ютерних магазинах.

Недолік живлення відеокарти може призвести до її перегріву, появі артефактів та виходу її системи живлення з ладу. Відеокарти NVidia, при нестачі живлення можуть почати попереджати повідомленнями виду: "відео драйвер перестав відповідати і був відновлений" або "підключіть додаткове живлення до відеокарти".

Високе енергоспоживання = велике тепловиділення. Якщо ваша відеокарта споживає багато енергії, подбайте про додаткові вентилятори на вдув та видув на корпусі. Або як тимчасовий захід - відкрийте бічну кришку. Постійно висока температура в корпусі - згубно впливає на строк служби всіх компонентів, починаючи материнською платою, закінчуючи .

Роз'єми.

Коли ви вже визначилися з відеокартою, варто звернути увагу і на роз'єми.

Якщо у вас монітор із матрицею P-або з підтримкою 30 бітного кольору (1.07 млрд.), то вам обов'язково знадобиться DisplayPortна відеокарті розкриття його потенціалу. Тільки DisplayPortпідтримує передачу 30 бітноїглибини кольору.

* достовірно невідомо, чи підтримують передачу 30 біт, ігрові відеокарти, але наявність DisplayPortговорить про можливу підтримку. У специфікаціях підтримка заявлена тільки у професійних відеокарт AMD FireProі NVidia Quadro.

Дуже добре, якщо є . Ніколи не знаєш, що може стати в нагоді і краще бути до цього готовим. Раптом вам знадобиться вивести сигнал із ресивера. До речі, HDMIі DVIсумісні через простий перехідник та практично без проблем.

Висновки.

На цьому все. Не встигли розпочати, вже закінчуємо. Оскільки стаття визначає основні, загальні поняття, вона вийшла дуже довгої.

Тим не менш, всі найважливіші моменти для вибору якісної та продуктивної відеокарти описані.

1. Питання віри.

3. Кількість виконавчих блоків (TMU, ROP тощо).

4. Об'єм, частота та розрядність шини пам'яті.

5. Дізнатися, чи підійде карта за рівнем енергоспоживання.

5. Система охолодження.

6. Роз'єми.

Сподіваємося, з цими знаннями, ви зможете відповідно до ваших вимог вибрати відеокарту.

Вдалого вам вибору!

Комп'ютерні підказки для користувачів-початківців

Отже, ми вирішили оновити конфігурацію.

Несподівані труднощі

Вихід є!

Словник базових графічних термінів

Частота оновлення (Refresh Rate)

Піксель (Pixel)

Вершина (Vertex)

Текстура (Texture)

Шейдер (Shader)

Швидкість заповнення (Fill Rate)

Архітектура графічного процесора: функції

Вершинні процесори (блоки вершинних шейдерів)

Піксельні процесори (блоки піксельних шейдерів)

Уніфіковані шейдери

Блоки накладання текстур (Texture Mapping Unit, TMU)

Блоки растрових операцій (Raster Operator Unit, ROP)

Конвеєри

Архітектура графічного процесора: технологія

Техпроцес

Тактова частота графічного процесора

Локальна відеопам'ять

Об'єм відеопам'яті

Ширина шини пам'яті

Типи пам'яті

Частота шини пам'яті

Інтерфейс відеокарти

Рішення на кількох відеокартах

Візуальні функції

Microsoft DirectX та версії Shader Model

HDR-освітлення та OpenEXR HDR

Повноекранне згладжування

Текстурна фільтрація

Текстури високої роздільної здатності

Архітектура графічного процесора: функції

Вершинні процесори (блоки вершинних шейдерів)

Піксельні процесори (блоки піксельних шейдерів)

Уніфіковані шейдери

Блоки накладання текстур (Texture Mapping Unit, TMU)

Блоки растрових операцій (Raster Operator Unit, ROP)

Конвеєри

Призначення відеокарти.

Отже. NVidiaабоAMD?

Архітектура чіпа.

Цінові категорії та що ми отримуємо, якщо купуємо відеокарту серією молодшою.

Згадка про драйвери.

Піксельні конвеєри, TMU, ROP.

Об'єм, частота та розрядність шини пам'яті.

Система охолодження.

Енергоспоживання відеокарти.

Роз'єми.

Висновки.

ПОХОДЖЕННЯ СТАТТІ