Liczba jednostek obliczeniowych (cieniujących) lub procesorów. Karta graficzna, jak wybrać. Często zadawane pytania dotyczące cech przy wyborze karty graficznej. Technologie, cechy producentów i architektury, systemy chłodzenia Liczba procesorów cieniujących

Na naszym forum codziennie dziesiątki osób pytają o porady dotyczące modernizacji własnego, w czym chętnie im pomożemy. Każdego dnia „oceniając montaż” i sprawdzając kompatybilność wybranych przez naszych klientów podzespołów, zaczęliśmy dostrzegać, że użytkownicy zwracają uwagę głównie na inne, niewątpliwie ważne podzespoły. I rzadko ktoś pamięta, że ​​\u200b\u200bpodczas aktualizacji komputera konieczna jest aktualizacja równie ważnego szczegółu -. A dziś opowiemy i pokażemy, dlaczego nie należy o tym zapominać.

„...Chcę zmodernizować mój komputer, aby wszystko śmigało, kupiłem procesor i7-3970X i płytę główną ASRock X79 Extreme6, a także kartę graficzną RADEON HD 7990 6 GB. Co jeszcze nan????777"
- tak zaczyna się mniej więcej połowa wszystkich komunikatów związanych z aktualizacją komputera stacjonarnego. W oparciu o budżet własny lub rodzinny użytkownicy starają się wybrać najbardziej, najzwinniejsze i najpiękniejsze moduły pamięci. Jednocześnie naiwnie wierząc, że ich stary 450W poradzi sobie zarówno z żarłoczną kartą graficzną, jak i „gorącym” procesorem podczas jednoczesnego podkręcania.

My ze swojej strony pisaliśmy już nie raz o znaczeniu zasilania - ale, przyznajemy, chyba nie było to wystarczająco jasne. Dlatego dzisiaj poprawiliśmy się i przygotowaliśmy dla Ciebie notatkę o tym, co się stanie, jeśli zapomnisz o tym podczas aktualizacji komputera - ze zdjęciami i szczegółowymi opisami.

Postanowiliśmy więc zaktualizować konfigurację...


W naszym eksperymencie zdecydowaliśmy się wziąć zupełnie nowy przeciętny komputer i ulepszyć go do poziomu „automatu do gier”. Konfiguracji nie trzeba będzie dużo zmieniać – wystarczy zmiana pamięci i karty graficznej, abyśmy mieli możliwość grania w mniej lub bardziej nowoczesne gry z przyzwoitymi ustawieniami szczegółowości. Wstępna konfiguracja naszego komputera wygląda następująco:

Jednostka mocy: ATX12V 400W

Oczywiste jest, że w przypadku gier taka konfiguracja jest, delikatnie mówiąc, raczej słaba. Czas więc na zmiany! Zaczniemy od tego samego, od czego większość ludzi, którzy chcą „uaktualnienia”, zaczyna - od. Płyty głównej nie będziemy wymieniać - o ile nam to odpowiada.

Ponieważ zdecydowaliśmy się nie dotykać płyty głównej, wybierzemy taką kompatybilną z gniazdem FM2 (na szczęście jest do tego specjalny przycisk na stronie NIX na stronie z opisem płyty głównej). Nie bądźmy chciwi – weźmy niedrogi, ale szybki i mocny procesor o częstotliwości 4,1 GHz (do 4,4 GHz w trybie Turbo CORE) i odblokowanym mnożnikiem – my też lubimy podkręcać, nic co ludzkie nie jest nam obce. Oto specyfikacje wybranego przez nas procesora:

Charakterystyka
Częstotliwość magistrali procesora 5000MHz Rozpraszanie mocy 100 W Częstotliwość procesora 4,1 GHz lub do 4,4 GHz w trybie Turbo CORE Rdzeń Richland Pamięć podręczna L1 96KB x2 Pamięć podręczna L2 2048 KB x2, działa z częstotliwością procesora obsługa 64-bitów Tak Liczba rdzeni 4 Mnożenie 41, odblokowany mnożnik Rdzeń wideo procesora AMD Radeon HD 8670D przy 844 MHz; Obsługa Shader Model 5 Maksymalna ilość pamięci RAM 64 GB Maks. liczba podłączonych monitorów 3 bezpośrednio podłączone lub do 4 monitorów za pomocą rozdzielaczy DisplayPort

Jeden pasek za 4 GB to nie nasz wybór. Po pierwsze chcemy mieć 16 GB, a po drugie musimy umożliwić pracę dwukanałową, dla której zainstalujemy w naszym komputerze dwa moduły pamięci po 8 GB każdy. Wysoka przepustowość, brak radiatorów i przyzwoita cena sprawiają, że jest to dla nas najsmaczniejszy wybór. Ponadto ze strony AMD można pobrać program Radeon RAMDisk, który pozwoli nam stworzyć superszybki dysk wirtualny do 6 GB zupełnie za darmo - a darmowe przydatne rzeczy uwielbiają wszyscy.


Charakterystyka
Pamięć 8 GB
Liczba modułów 2
Norma pamięci PC3-10600 (DDR3 1333MHz)
Częstotliwość pracy do 1333 MHz
Czasy 9-9-9-24
Napięcie zasilania 1,5 V
Przepustowość łącza 10667 Mb/s

Możesz wygodnie odtwarzać wbudowane wideo tylko w Minesweeper. Dlatego, aby uaktualnić komputer do poziomu gier, wybraliśmy nowoczesny i wydajny, ale nie najdroższy.


Została wyposażona w 2 GB pamięci wideo, obsługę DirectX 11 i OpenGL 4.x. oraz doskonały system chłodzenia Twin Frozr IV. Jego wydajność powinna nam w zupełności wystarczyć do grania w najnowsze odsłony najpopularniejszych serii gier, takich jak Tomb Raider, Crysis, Hitman i Far cry. Cechy naszego wyboru są następujące:


Charakterystyka
GPU GeForce GTX 770
Częstotliwość GPU 1098 MHz lub do 1150 MHz z GPU Boost
Liczba procesorów cieniujących 1536
pamięć wideo 2 GB
Typ pamięci wideo GDDR5
Szerokość magistrali pamięci wideo 256 bitów
Częstotliwość pamięci wideo 1753 MHz (QDR 7,010 GHz)
Liczba potoków pikseli 128, 32 jednostki próbkowania tekstury
Interfejs PCI Express 3.0 16x (kompatybilny z PCI Express 2.x/1.x) z możliwością łączenia kart za pomocą SLI.
Porty DisplayPort, DVI-D, DVI-I, HDMI, przejściówka D-Sub w zestawie
Chłodzenie karty graficznej Aktywny (radiator + 2 wentylatory Twin Frozr IV z przodu płyty)
Złącze zasilania 8pin + 8pin
Wsparcie API DirectX 11 i OpenGL 4.x
Długość karty graficznej (mierzona w NYX) 263 mm
Wsparcie komputerowe ogólny cel na GPU DirectCompute 11, NVIDIA PhysX, CUDA, CUDA C++, OpenCL 1.0
Maksymalne zużycie energii FurMark+WinRar 255 W
ocena wydajności 61.5

Nieoczekiwane trudności

Teraz mamy wszystko, czego potrzebujemy, aby zaktualizować nasz komputer. Zainstalujemy nowe komponenty w naszej istniejącej obudowie.


Uruchamiamy - i to nie działa. I dlaczego? Ale ponieważ budżetowe zasilacze nie są fizycznie w stanie uruchomić komputera z odrobiną. Faktem jest, że w naszym przypadku do zasilania potrzebne są dwa 8-pinowe złącza, a zasilacz ma tylko jedno 6-pinowe złącze zasilania karty graficznej „w podstawie”. Biorąc pod uwagę, że o wiele więcej wymaga jeszcze większej liczby złączy niż w naszym przypadku, staje się jasne, że należy zmienić zasilacz.

Ale to wciąż połowa kłopotów. Pomyśl tylko, nie ma złącza zasilania! W naszym laboratorium testowym były dość rzadkie przejściówki z 6-pin na 8-pin i z molex na 6-pin. Jak te:


Warto zauważyć, że nawet w przypadku budżetowych nowoczesnych zasilaczy, z każdą nową wersją złączy Molex jest ich coraz mniej - można więc powiedzieć, że mieliśmy szczęście.

Na pierwszy rzut oka wszystko jest w porządku, a dzięki kilku sztuczkom udało nam się zaktualizować Jednostka systemowa do konfiguracji „grającej”. Teraz zasymulujmy obciążenie, uruchamiając jednocześnie test Furmark i archiwizator 7Zip w trybie Xtreme Burning na naszym nowym komputerze do gier. Mogliśmy uruchomić komputer - już dobrze. System wytrzymał również uruchomienie Furmark. Uruchamiamy archiwizator - i co to jest?! Komputer wyłączył się, wcześniej zadowalając nas rykiem maksymalnie odkręconego wentylatora. „Szybki” zwykły 400 W zawiódł, bez względu na to, jak bardzo się starał, zasilić kartę graficzną i potężny procesor. A przez mierny układ chłodzenia nasz mocno się nagrzał i nawet maksymalne obroty wentylatora nie pozwoliły wyprodukować przynajmniej deklarowanych 400W.

Jest wyjście!

popłynął. Kupiliśmy drogie komponenty do złożenia komputera do gier, ale okazuje się, że nie da się na nim grać. Szkoda. Wniosek jest jasny dla wszystkich: stary nie nadaje się do naszego komputer do gier i trzeba go wymienić na nowy. Ale który konkretnie?

Do naszego pompowanego komputera wybraliśmy według czterech głównych kryteriów:

Pierwszym z nich jest oczywiście władza. Woleliśmy wybierać z marginesem - chcemy też podkręcić procesor i zdobyć punkty w testach syntetycznych. Biorąc pod uwagę wszystko, czego możemy potrzebować w przyszłości, zdecydowaliśmy się na moc co najmniej 800W.

Drugim kryterium jest niezawodność.. Naprawdę chcemy, aby ten wzięty „z marginesem” przetrwał następną generację kart graficznych i procesorów, nie wypalił się i jednocześnie nie spalił drogich komponentów (wraz z witryną testową). Dlatego naszym wyborem są tylko japońskie kondensatory, tylko zabezpieczenie przeciwzwarciowe i niezawodne zabezpieczenie przed przeciążeniem któregokolwiek z wyjść.

Trzecim punktem naszych wymagań jest wygoda i funkcjonalność.. Na początek potrzebujemy - komputer będzie często działał, a szczególnie hałaśliwe zasilacze w połączeniu z kartą graficzną i chłodnicą procesora doprowadzą każdego użytkownika do szaleństwa. Poza tym poczucie piękna nie jest nam obce, dlatego nowy zasilacz do naszego gamingowego komputera powinien być modułowy i posiadać odłączane kable i złącza. Aby nie było nic zbędnego.

I wreszcie, kryterium jest efektywności energetycznej. Tak, dbamy zarówno o środowisko, jak i rachunki za prąd. Dlatego wybrany przez nas zasilacz musi spełniać co najmniej normę efektywności energetycznej 80+ Bronze.

Porównując i analizując wszystkie wymagania, wybraliśmy spośród nielicznych kandydatów, którzy najpełniej spełnili wszystkie nasze wymagania. Stały się mocą 850W. Warto zauważyć, że w wielu parametrach nawet przekroczył nasze wymagania. Zobaczmy jego specyfikację:

Specyfikacje zasilania
Rodzaj wyposażenia Zasilacz z aktywnym modułem PFC (Power Factor Correction).
Nieruchomości Plecionka pętlowa, kondensatory japońskie, zabezpieczenie przeciwzwarciowe (SCP), zabezpieczenie przepięciowe (OVP), zabezpieczenie przeciążeniowe każdego z wyjść urządzenia z osobna (OCP)
+3,3V - 24A, +5V - 24A, +12V - 70A, +5VSB - 3,0A, -12V - 0,5A
Odpinane kable zasilające Tak
efektywność 90%, certyfikat 80 PLUS Gold
Moc zasilacza 850 W
Złącze zasilania płyty głównej 24+8+8 pinów, 24+8+4 pinów, 24+8 pinów, 24+4 pinów, 20+4 pinów
Złącze zasilania karty graficznej 6x złącza 6/8-pin (złącze 8-pin odłączane - 2 piny odłączane)
MTBF 100 tysięcy godzin
Chłodzenie zasilacza 1 wentylator: 140 x 140 mm (na dolnej ścianie). Pasywny układ chłodzenia pod obciążeniem do 50%.
Kontrola prędkości wentylatora Z termostatu. Zmiana prędkości wentylatora w zależności od temperatury wewnątrz zasilacza. Ręczny wybór trybu pracy wentylatora. W trybie normalnym wentylator obraca się stale, aw trybie cichym całkowicie zatrzymuje się przy niskim obciążeniu.


, jeden z najlepszych za te pieniądze. Zainstalujmy to w naszym przypadku:


Stało się tutaj coś, co nas trochę zmyliło. Wydawałoby się, że wszystko zostało poprawnie zmontowane, wszystko było podłączone, wszystko działało - a zasilacz milczy! Czyli generalnie: wentylator jak stał to nadal stoi, a system się uruchomił i działa poprawnie. Faktem jest, że przy obciążeniu do 50% zasilacz pracuje w tzw. trybie cichym - bez obracania wentylatora układu chłodzenia. Wentylator buczy tylko przy dużym obciążeniu - jednoczesne uruchomienie archiwizatorów i Furmarka nadal powodowało, że kręciło się chłodniej.


Zasilacz posiada aż sześć 8-pinowych 6-pinowych złączy zasilania karty graficznej, z których każde to składane złącze 8-pinowe, z którego w razie potrzeby można odpiąć 2 piny. W ten sposób jest w stanie zasilić dowolną kartę graficzną bez zbędnych kłopotów i trudności. I nawet nie jeden.


Modułowy system zasilania pozwala na odpięcie zbędnych i niepotrzebnych kabli zasilających, co poprawia wentylację obudowy, stabilność systemu i oczywiście poprawia estetykę. wygląd przestrzeni wewnętrznej, co pozwala śmiało polecić ją modderom i fanom obudów z okienkami.
kup niezawodny i mocny zasilacz. W naszej recenzji stał się. - i jak widać nieprzypadkowo. Kupując to samo w NYKS, możesz być pewien, że wszystkie komponenty Twojego wysokowydajnego systemu będą zaopatrzone w wystarczającą i nieprzerwane źródło zasilania, nawet przy ekstremalnym przetaktowywaniu.


Poza tym zasilacz wystarczy na kilka lat do przodu – lepiej z marginesem, na wypadek gdybyś w przyszłości zamierzał rozbudować system o podzespoły z wyższej półki.

Podstawowe elementy karty graficznej:

  • wyjścia;
  • interfejsy;
  • system chłodzenia;
  • procesor graficzny;
  • pamięć wideo.

Technologie graficzne:

  • słownik;
  • Architektura GPU: funkcje
    jednostki wierzchołków/pikseli, shadery, szybkość wypełniania, jednostki tekstur/rastrów, potoki;
  • Architektura GPU: technologia
    proces produkcyjny, częstotliwość GPU, lokalna pamięć wideo (rozmiar, magistrala, typ, częstotliwość), rozwiązania z wieloma kartami graficznymi;
  • cechy wizualne
    DirectX, wysoki zakres dynamiki (HDR), FSAA, filtrowanie tekstur, tekstury o wysokiej rozdzielczości.

Słowniczek podstawowych terminów graficznych

Częstotliwość odświeżania

Podobnie jak w kinie lub na telewizorze, komputer symuluje ruch na monitorze, wyświetlając sekwencję klatek. Częstotliwość odświeżania monitora wskazuje, ile razy na sekundę obraz będzie aktualizowany na ekranie. Na przykład 75 Hz odpowiada 75 aktualizacjom na sekundę.

Jeśli komputer przetwarza klatki szybciej, niż monitor jest w stanie wyświetlić, mogą wystąpić problemy z grami. Na przykład, jeśli komputer oblicza 100 klatek na sekundę, a częstotliwość odświeżania monitora wynosi 75 Hz, to z powodu nakładek monitor może wyświetlić tylko część obrazu w okresie odświeżania. W rezultacie pojawiają się wizualne artefakty.

Jako rozwiązanie możesz włączyć V-Sync (synchronizację pionową). Ogranicza liczbę klatek, które komputer może wytworzyć do częstotliwości odświeżania monitora, zapobiegając powstawaniu artefaktów. Jeśli włączysz V-Sync, liczba klatek renderowanych w grze nigdy nie przekroczy częstotliwości odświeżania. Oznacza to, że przy 75 Hz komputer będzie wyświetlał nie więcej niż 75 klatek na sekundę.

Piksel

Słowo „piksel” oznacza „ fotka tura el ement” jest elementem obrazu. Jest to maleńka kropka na wyświetlaczu, która może świecić w określonym kolorze (w większości przypadków odcień jest wyświetlany jako kombinacja trzech podstawowych kolorów: czerwonego, zielonego i niebieskiego). Jeśli rozdzielczość ekranu wynosi 1024 × 768, możesz zobaczyć matrycę o szerokości 1024 pikseli i wysokości 768 pikseli. Razem piksele tworzą obraz. Obraz na ekranie jest aktualizowany od 60 do 120 razy na sekundę, w zależności od rodzaju wyświetlacza i danych dostarczanych przez wyjście karty graficznej. Monitory CRT aktualizują wyświetlaną linię po linii, podczas gdy płaskie monitory LCD mogą aktualizować każdy piksel indywidualnie.

Wierzchołek

Wszystkie obiekty w scenie 3D składają się z wierzchołków. Wierzchołek to punkt w przestrzeni 3D o współrzędnych x, y i z. Kilka wierzchołków można zgrupować w wielokąt: najczęściej trójkąt, ale możliwe są bardziej złożone kształty. Wielokąt jest następnie teksturowany, aby obiekt wyglądał realistycznie. Sześcian 3D pokazany na powyższej ilustracji ma osiem wierzchołków. Bardziej złożone obiekty mają zakrzywione powierzchnie, które w rzeczywistości składają się z bardzo dużej liczby wierzchołków.

Tekstura

Tekstura to po prostu obraz 2D o dowolnym rozmiarze, który jest nakładany na obiekt 3D w celu symulacji jego powierzchni. Na przykład nasz sześcian 3D ma osiem wierzchołków. Tak wygląda przed mapowaniem tekstur proste pudełko. Ale kiedy nakładamy teksturę, pudełko staje się kolorowe.

Shader

Oprogramowanie Pixel Shader pozwala karcie graficznej generować imponujące efekty, takie jak ta woda Starsze Zwoje: Zapomnienie.

Obecnie istnieją dwa typy shaderów: wierzchołki i piksele. Moduły cieniujące wierzchołków mogą modyfikować lub przekształcać obiekty 3D. Programy Pixel Shader umożliwiają zmianę kolorów pikseli na podstawie niektórych danych. Wyobraź sobie źródło światła w scenie 3D, które sprawia, że ​​oświetlane obiekty świecą jaśniej, a jednocześnie rzuca cienie na inne obiekty. Wszystko to jest realizowane poprzez zmianę informacji o kolorze pikseli.

Pixel shadery służą do tworzenia złożonych efektów w Twoich ulubionych grach. Na przykład kod modułu cieniującego może sprawić, że piksele otaczające miecz 3D będą jaśniej świecić. Inny moduł cieniujący może przetwarzać wszystkie wierzchołki złożonego obiektu 3D i symulować eksplozję. Twórcy gier coraz częściej sięgają po złożone programy do cieniowania, aby tworzyć realistyczną grafikę. Prawie każda nowoczesna gra bogata w grafikę używa shaderów.

Wraz z wydaniem kolejnego interfejsu programowania aplikacji (API, Application Programming Interface) Microsoft DirectX 10, zostanie wydany trzeci typ shaderów o nazwie shadery geometrii. Z ich pomocą będzie można rozbijać obiekty, modyfikować je, a nawet niszczyć, w zależności od pożądanego rezultatu. Trzeci typ shaderów można zaprogramować dokładnie tak samo jak dwa pierwsze, ale jego rola będzie inna.

Szybkość wypełnienia

Bardzo często na pudełku z kartą graficzną można znaleźć wartość współczynnika wypełnienia. Zasadniczo współczynnik wypełnienia wskazuje, jak szybko GPU może renderować piksele. Starsze karty graficzne miały współczynnik wypełnienia trójkąta. Ale obecnie istnieją dwa rodzaje współczynnika wypełnienia: współczynnik wypełnienia pikseli i współczynnik wypełnienia teksturą. Jak już wspomniano, szybkość wypełniania pikseli odpowiada szybkości wyjściowej pikseli. Jest obliczana jako liczba operacji rastrowych (ROP) pomnożona przez częstotliwość zegara.

ATi i nVidia inaczej obliczają współczynniki wypełnienia teksturami. Nvidia uważa, że ​​prędkość uzyskuje się mnożąc liczbę potoków pikseli przez szybkość zegara. A ATi mnoży liczbę jednostek tekstury przez szybkość zegara. W zasadzie obie metody są poprawne, ponieważ nVidia używa jednej jednostki tekstury na jednostkę cieniowania pikseli (czyli jednego potoku na piksel).

Pamiętając o tych definicjach, przejdźmy dalej i omówmy najważniejsze funkcje GPU, ich działanie i dlaczego są tak ważne.

Architektura GPU: funkcje

Realizm grafiki 3D jest bardzo zależny od wydajności karty graficznej. Im więcej bloków Pixel Shader zawiera procesor i im wyższa częstotliwość, tym więcej efektów można zastosować do sceny 3D, aby poprawić jej percepcję wizualną.

GPU zawiera wiele różnych bloków funkcjonalnych. Na podstawie liczby niektórych komponentów można oszacować, jak potężny jest procesor graficzny. Zanim przejdziemy dalej, przyjrzyjmy się najważniejszym blokom funkcjonalnym.

Procesory wierzchołków (jednostki cieniowania wierzchołków)

Podobnie jak moduły cieniujące piksele, procesory wierzchołków wykonują kod modułu cieniującego, który dotyka wierzchołków. Ponieważ większy budżet wierzchołków umożliwia tworzenie bardziej złożonych obiektów 3D, wydajność procesorów wierzchołków jest bardzo ważna w scenach 3D zawierających złożone lub duże liczby obiektów. Jednak jednostki cieniujące wierzchołki nadal nie mają tak oczywistego wpływu na wydajność, jak procesory pikselowe.

Procesory pikseli (cieniowanie pikseli)

Procesor pikselowy jest elementem układu graficznego przeznaczonym do przetwarzania programów cieniujących piksel. Procesory te wykonują obliczenia odnoszące się wyłącznie do pikseli. Ponieważ piksele zawierają informacje o kolorze, moduły cieniujące piksele mogą osiągnąć imponujące efekty graficzne. Na przykład większość efektów wodnych, które można zobaczyć w grach, jest tworzonych przy użyciu shaderów pikseli. Zazwyczaj liczba procesorów pikseli jest używana do porównania wydajności pikseli kart graficznych. Jeśli jedna karta jest wyposażona w osiem jednostek cieniowania pikseli, a druga w 16 jednostek, to całkiem logiczne jest założenie, że karta graficzna z 16 jednostkami będzie szybciej przetwarzać złożone programy pikseli. Należy również wziąć pod uwagę szybkość zegara, ale obecnie podwojenie liczby procesorów pikselowych jest bardziej wydajne pod względem zużycia energii niż podwojenie częstotliwości układu graficznego.

Ujednolicone shadery

Zunifikowane (pojedyncze) shadery nie zawitały jeszcze w świecie PC, ale nadchodzący standard DirectX 10 opiera się na podobnej architekturze. Oznacza to, że struktura kodu programów wierzchołkowych, geometrycznych i pikselowych będzie taka sama, chociaż shadery będą wykonywać inną pracę. Z nową specyfikacją można zapoznać się na konsoli Xbox 360, gdzie układ graficzny został zaprojektowany przez firmę ATi dla firmy Microsoft. Bardzo ciekawie będzie zobaczyć, jaki potencjał niesie ze sobą nowy DirectX 10.

Jednostki mapowania tekstury (TMU)

Tekstury należy wybrać i przefiltrować. Ta praca jest wykonywana przez jednostki mapowania tekstur, które działają w połączeniu z jednostkami cieniującymi piksele i wierzchołki. Zadaniem TMU jest zastosowanie operacji na teksturach do pikseli. Liczba jednostek tekstur w GPU jest często używana do porównywania wydajności tekstur kart graficznych. Całkiem rozsądne jest założenie, że karta graficzna z większą liczbą jednostek TMU zapewni lepszą wydajność tekstur.

Raster Operator Unit (ROP)

Procesory RIP są odpowiedzialne za zapisywanie danych pikseli w pamięci. Szybkość, z jaką wykonywana jest ta operacja, jest szybkością napełniania. We wczesnych latach akceleratorów 3D liczba ROP i współczynniki wypełnienia były bardzo duże ważne cechy karty wideo. Dziś praca ROP jest nadal ważna, ale wydajność karty graficznej nie jest już ograniczona tymi blokami, jak to było kiedyś. Dlatego wydajność (i liczba) ROP jest rzadko używana do oceny szybkości karty graficznej.

przenośniki

Potoki są używane do opisywania architektury kart graficznych i dają bardzo wizualną reprezentację wydajności procesora graficznego.

Przenośnik nie może być uważany za ściśle techniczny termin. GPU używa różnych potoków, które wykonują różne funkcje. W przeszłości potok był rozumiany jako procesor pikseli, który był podłączony do własnej jednostki mapowania tekstur (TMU). Na przykład karta graficzna Radeon 9700 wykorzystuje osiem procesorów pikseli, z których każdy jest podłączony do własnego TMU, więc uważa się, że karta ma osiem potoków.

Ale bardzo trudno jest opisać nowoczesne procesory liczbą potoków. W porównaniu z poprzednimi konstrukcjami, nowe procesory wykorzystują modułową, fragmentaryczną strukturę. ATi można uznać za innowatora w tej dziedzinie, który wraz z linią kart graficznych X1000 przeszedł na strukturę modułową, co umożliwiło osiągnięcie wzrostu wydajności poprzez wewnętrzną optymalizację. Niektóre bloki procesora są używane częściej niż inne, a aby poprawić wydajność GPU, ATi próbowało znaleźć kompromis między liczbą potrzebnych bloków a obszarem matrycy (nie można go zbytnio zwiększyć). W tej architekturze termin „potok pikseli” stracił już swoje znaczenie, ponieważ procesory pikseli nie są już podłączone do własnych TMU. Na przykład procesor graficzny ATi Radeon X1600 ma 12 shaderów pikseli i łącznie cztery jednostki TMU. Dlatego nie można powiedzieć, że w architekturze tego procesora jest 12 potoków pikselowych, tak jak nie można powiedzieć, że jest ich tylko cztery. Jednak zgodnie z tradycją nadal wspomina się o potokach pikselowych.

Mając na uwadze te założenia, liczba potoków pikseli w GPU jest często używana do porównywania kart graficznych (z wyjątkiem linii ATi X1x00). Na przykład, jeśli weźmiemy karty graficzne z 24 i 16 potokami, całkiem rozsądne jest założenie, że karta z 24 potokami będzie szybsza.

Architektura GPU: technologia

Proces technologii

Termin ten odnosi się do wielkości jednego elementu (tranzystora) chipa oraz dokładności procesu produkcyjnego. Udoskonalenie procesów technicznych pozwala na uzyskanie elementów o mniejszych gabarytach. Na przykład proces 0,18 µm daje większe elementy niż proces 0,13 µm, więc nie jest tak wydajny. Mniejsze tranzystory działają na niższym napięciu. Z kolei spadek napięcia prowadzi do zmniejszenia oporu cieplnego, co zmniejsza ilość wydzielanego ciepła. Ulepszenie technologii procesu pozwala zmniejszyć odległość między blokami funkcjonalnymi chipa, a przesyłanie danych zajmuje mniej czasu. Krótsze odległości, niższe napięcia i inne ulepszenia pozwalają osiągnąć wyższe częstotliwości taktowania.

Nieco komplikuje zrozumienie, że zarówno mikrometry (µm), jak i nanometry (nm) są dziś używane do oznaczania technologii procesowej. W rzeczywistości wszystko jest bardzo proste: 1 nanometr to 0,001 mikrometra, więc procesy produkcyjne 0,09 mikrona i 90 nm to to samo. Jak wspomniano powyżej, mniejsza technologia procesowa pozwala uzyskać wyższe częstotliwości taktowania. Na przykład, jeśli porównamy karty graficzne z chipami 0,18 mikrona i 0,09 mikrona (90 nm), to całkiem rozsądne jest oczekiwanie wyższej częstotliwości od karty 90 nm.

Szybkość zegara GPU

Szybkość zegara GPU jest mierzona w megahercach (MHz), czyli milionach cykli na sekundę.

Szybkość zegara bezpośrednio wpływa na wydajność GPU. Im jest wyższy, tym więcej pracy można wykonać na sekundę. Jako pierwszy przykład weźmy karty graficzne nVidia GeForce 6600 i 6600 GT: procesor graficzny 6600 GT pracuje z częstotliwością 500 MHz, podczas gdy zwykła karta 6600 pracuje z częstotliwością 400 MHz. Ponieważ procesory są technicznie identyczne, zwiększenie szybkości zegara o 20% w 6600 GT skutkuje lepszą wydajnością.

Szybkość zegara to jednak nie wszystko. Należy pamiętać, że na wydajność duży wpływ ma architektura. Jako drugi przykład weźmy karty graficzne GeForce 6600 GT i GeForce 6800 GT. Częstotliwość GPU 6600 GT wynosi 500 MHz, ale 6800 GT działa tylko z częstotliwością 350 MHz. Weźmy teraz pod uwagę, że 6800 GT wykorzystuje 16 potoków pikseli, podczas gdy 6600 GT ma tylko osiem. Dlatego 6800 GT z 16 potokami przy 350 MHz zapewni mniej więcej taką samą wydajność jak procesor z ośmioma potokami i dwukrotnie większą częstotliwością taktowania (700 MHz). Powiedziawszy to, prędkość zegara może być wykorzystana do porównania wydajności.

Lokalna pamięć wideo

Pamięć karty graficznej ma ogromny wpływ na wydajność. Ale różne ustawienia pamięci wpływają inaczej.

Pamięć wideo

Ilość pamięci wideo można prawdopodobnie nazwać parametrem karty graficznej, który jest najbardziej przeceniany. Niedoświadczeni konsumenci często używają ilości pamięci wideo do porównywania różnych kart, ale w rzeczywistości ilość ma niewielki wpływ na wydajność w porównaniu z parametrami, takimi jak częstotliwość magistrali pamięci i interfejs (szerokość magistrali).

W większości przypadków karta ze 128 MB pamięci wideo będzie działać prawie tak samo jak karta z 256 MB. Oczywiście są sytuacje, w których większa ilość pamięci prowadzi do lepszej wydajności, ale pamiętaj, że większa ilość pamięci nie spowoduje automatycznego zwiększenia szybkości w grach.

Głośność jest przydatna w grach z teksturami o wysokiej rozdzielczości. Twórcy gier dołączają do gry kilka zestawów tekstur. A im więcej pamięci na karcie graficznej, tym wyższa rozdzielczość załadowanych tekstur. Tekstury o wysokiej rozdzielczości zapewniają lepszą rozdzielczość i szczegółowość w grze. Dlatego całkiem rozsądne jest wzięcie karty z dużą ilością pamięci, jeśli wszystkie inne kryteria są takie same. Przypomnijmy jeszcze raz, że szerokość magistrali pamięci i jej częstotliwość mają znacznie silniejszy wpływ na wydajność niż ilość pamięci fizycznej na karcie.

Szerokość magistrali pamięci

Szerokość magistrali pamięci jest jednym z najważniejszych aspektów wydajności pamięci. Nowoczesne magistrale mają szerokość od 64 do 256 bitów, aw niektórych przypadkach nawet 512 bitów. Im szersza magistrala pamięci, tym więcej informacji może przesłać na zegar. A to bezpośrednio wpływa na wydajność. Na przykład, jeśli weźmiemy dwie magistrale o równych częstotliwościach, to teoretycznie magistrala 128-bitowa prześle dwa razy więcej danych na zegar niż magistrala 64-bitowa. Magistrala 256-bitowa jest dwa razy większa.

Większa przepustowość magistrali (wyrażona w bitach lub bajtach na sekundę, 1 bajt = 8 bitów) zapewnia lepszą wydajność pamięci. Dlatego magistrala pamięci jest znacznie ważniejsza niż jej rozmiar. Przy równych częstotliwościach 64-bitowa magistrala pamięci działa tylko na 25% szyny 256-bitowej!

Weźmy następujący przykład. Karta wideo ze 128 MB pamięci wideo, ale z magistralą 256-bitową zapewnia znacznie lepszą wydajność pamięci niż model z 512 MB i szyną 64-bitową. Warto zauważyć, że w przypadku niektórych kart z serii ATi X1x00 producenci określają specyfikację wewnętrznej szyny pamięci, ale nas interesują parametry szyny zewnętrznej. Na przykład wewnętrzna magistrala pierścieniowa X1600 ma szerokość 256 bitów, a zewnętrzna tylko 128 bitów. W rzeczywistości magistrala pamięci działa z wydajnością 128-bitową.

Typy pamięci

Pamięci można podzielić na dwie główne kategorie: SDR (pojedynczy transfer danych) i DDR (podwójny transfer danych), w których dane są przesyłane z dwukrotnie większą szybkością taktowania. Obecnie technologia pojedynczej transmisji SDR jest przestarzała. Ponieważ pamięć DDR przesyła dane dwa razy szybciej niż SDR, należy pamiętać, że karty graficzne z pamięcią DDR często wskazują podwójną częstotliwość, a nie fizyczną. Na przykład, jeśli pamięć DDR jest wymieniona na 1000 MHz, jest to efektywna częstotliwość, z jaką zwykła pamięć SDR musi działać, aby zapewnić tę samą przepustowość. Ale w rzeczywistości częstotliwość fizyczna wynosi 500 MHz.

Z tego powodu wiele osób jest zaskoczonych, gdy pamięć ich karty graficznej jest wymieniona na 1200 MHz DDR, podczas gdy programy narzędziowe podają 600 MHz. Więc będziesz musiał się do tego przyzwyczaić. Pamięci DDR2 i GDDR3/GDDR4 działają na tej samej zasadzie, czyli z podwójnym transferem danych. Różnica między pamięciami DDR, DDR2, GDDR3 i GDDR4 polega na technologii produkcji i niektórych szczegółach. DDR2 może działać na wyższych częstotliwościach niż pamięć DDR i DDR3 - nawet wyższy niż DDR2.

Częstotliwość magistrali pamięci

Podobnie jak procesor, pamięć (a dokładniej magistrala pamięci) działa z określoną częstotliwością zegara, mierzoną w megahercach. W tym przypadku zwiększenie częstotliwości zegara bezpośrednio wpływa na wydajność pamięci. A częstotliwość magistrali pamięci jest jednym z parametrów używanych do porównywania wydajności kart graficznych. Na przykład, jeśli wszystkie inne cechy (szerokość magistrali pamięci itp.) Są takie same, całkiem logiczne jest stwierdzenie, że karta graficzna z pamięcią 700 MHz jest szybsza niż karta 500 MHz.

Ponownie, szybkość zegara to nie wszystko. Pamięć 700 MHz z magistralą 64-bitową będzie wolniejsza niż pamięć 400 MHz z magistralą 128-bitową. Wydajność pamięci 400 MHz na magistrali 128-bitowej odpowiada w przybliżeniu pamięci 800 MHz na szynie 64-bitowej. Należy również pamiętać, że taktowania GPU i pamięci to zupełnie inne parametry i zwykle są różne.

Interfejs karty wideo

Wszystkie dane przesyłane między kartą graficzną a procesorem przechodzą przez interfejs karty graficznej. Obecnie w kartach graficznych stosowane są trzy typy interfejsów: PCI, AGP i PCI Express. Różnią się przepustowością i innymi cechami. Oczywiste jest, że im większa przepustowość, tym wyższy kurs wymiany. Jednak tylko najnowocześniejsze karty mogą wykorzystywać wysoką przepustowość, i to tylko częściowo. W pewnym momencie szybkość interfejsu przestała być „wąskim gardłem”, dziś po prostu wystarczy.

Najwolniejszą magistralą, dla której wyprodukowano karty graficzne, jest PCI (Peripheral Components Interconnect). Oczywiście bez zagłębiania się w historię. PCI naprawdę pogorszyło wydajność kart graficznych, więc przełączyli się na interfejs AGP (Accelerated Graphics Port). Ale nawet specyfikacje AGP 1.0 i 2x ograniczały wydajność. Kiedy standard zwiększył prędkość do AGP 4x, zaczęliśmy zbliżać się do praktycznego limitu przepustowości, z której mogą korzystać karty graficzne. Specyfikacja AGP 8x po raz kolejny podwoiła przepustowość w porównaniu z AGP 4x (2,16 GB/s), ale nie uzyskaliśmy zauważalnego wzrostu wydajności grafiki.

Najnowszą i najszybszą magistralą jest PCI Express. Nowsze karty graficzne zazwyczaj korzystają z interfejsu PCI Express x16, który łączy 16 linii PCI Express, zapewniając łączną przepustowość 4 GB/s (w jednym kierunku). To dwukrotnie większa przepustowość niż AGP 8x. Magistrala PCI Express zapewnia wspomnianą przepustowość w obu kierunkach (przesyłanie danych do iz karty graficznej). Ale szybkość standardu AGP 8x była już wystarczająca, więc nie widzieliśmy sytuacji, w której przejście na PCI Express dałoby wzrost wydajności w porównaniu z AGP 8x (jeśli inne parametry sprzętowe są takie same). Na przykład wersja AGP GeForce 6800 Ultra będzie działać identycznie jak 6800 Ultra dla PCI Express.

Dziś najlepiej kupić kartę z interfejsem PCI Express, wytrzyma ona na rynku jeszcze kilka lat. Najbardziej wydajne karty nie są już produkowane z interfejsem AGP 8x, a rozwiązania PCI Express z reguły są już łatwiejsze do znalezienia niż analogi AGP i są tańsze.

Rozwiązania wieloprocesorowe

Używanie wielu kart graficznych w celu zwiększenia wydajności grafiki nie jest nowym pomysłem. We wczesnych latach grafiki 3D firma 3dfx weszła na rynek z dwiema równolegle działającymi kartami graficznymi. Ale wraz ze zniknięciem 3dfx zapomniano o technologii współpracy kilku konsumenckich kart graficznych, chociaż ATi produkuje podobne systemy dla profesjonalnych symulatorów od czasu wypuszczenia Radeona 9700. Kilka lat temu technologia powróciła na rynek z pojawienie się rozwiązań nVidia SLI, a nieco później ATi Crossfire.

Współdzielenie wielu kart graficznych zapewnia wystarczającą wydajność, aby uruchomić grę przy wysokich ustawieniach jakości w wysokiej rozdzielczości. Ale wybór jednego lub drugiego nie jest łatwy.

Zacznijmy od tego, że wymagają tego rozwiązania oparte na wielu kartach graficznych duża liczba energii, więc zasilacz musi być wystarczająco mocny. Całe to ciepło będzie musiało zostać usunięte z karty graficznej, dlatego należy zwrócić uwagę na obudowę komputera i chłodzenie, aby system się nie przegrzał.

Pamiętaj też, że SLI/CrossFire wymaga odpowiedniej płyty głównej (dla tej lub innej technologii), która jest zwykle droższa niż standardowe modele. Konfiguracja nVidia SLI będzie działać tylko na niektórych kartach nForce4, podczas gdy karty ATi CrossFire będą działać tylko na płyty główne z chipsetem CrossFire lub w niektórych modelach Intela. Co gorsza, niektóre konfiguracje CrossFire wymagają specjalnej karty: CrossFire Edition. Po wydaniu CrossFire dla niektórych modeli kart graficznych, ATi pozwoliło włączyć technologię wspólnej pracy nad magistrala PCI Express, a wraz z wydaniem nowych wersji sterowników liczba możliwych kombinacji wzrasta. Ale wciąż sprzętowy CrossFire z odpowiednią kartą CrossFire Edition daje lepszą wydajność. Ale karty CrossFire Edition są również droższe niż zwykłe modele. Obecnie można włączyć tryb programowy CrossFire (bez karty CrossFire Edition) na kartach graficznych Radeon X1300, X1600 i X1800 GTO.

Należy również wziąć pod uwagę inne czynniki. Chociaż dwie współpracujące ze sobą karty graficzne dają wzrost wydajności, jest on daleki od dwukrotnego. Ale zapłacisz dwa razy więcej pieniędzy. Najczęściej wzrost wydajności wynosi 20-60%. A w niektórych przypadkach, ze względu na dodatkowe koszty obliczeniowe związane z dopasowaniem, nie ma żadnego zysku. Z tego powodu jest mało prawdopodobne, aby konfiguracje z wieloma kartami opłacały się w przypadku tanich modeli, ponieważ droższa karta graficzna zwykle zawsze przewyższa parę tanich kart. Ogólnie rzecz biorąc, dla większości konsumentów wybór rozwiązania SLI / CrossFire nie ma sensu. Ale jeśli chcesz włączyć wszystkie opcje poprawy jakości lub grać w ekstremalnych rozdzielczościach, na przykład 2560x1600, kiedy musisz obliczyć więcej niż 4 miliony pikseli na klatkę, niezbędne są dwie lub cztery sparowane karty graficzne.

Funkcje wizualne

Oprócz specyfikacji czysto sprzętowych, różne generacje i modele procesorów graficznych mogą różnić się zestawami funkcji. Na przykład często mówi się, że karty generacji ATi Radeon X800 XT są kompatybilne z Shader Model 2.0b (SM), podczas gdy nVidia GeForce 6800 Ultra jest kompatybilna z SM 3.0, chociaż ich specyfikacje sprzętowe są do siebie zbliżone (16 potoków) . Dlatego wielu konsumentów dokonuje wyboru na korzyść jednego lub drugiego rozwiązania, nawet nie wiedząc, co oznacza ta różnica.

Wersje Microsoft DirectX i Shader Model

Te nazwy są najczęściej używane w sporach, ale niewiele osób wie, co tak naprawdę oznaczają. Aby to zrozumieć, zacznijmy od historii graficznych interfejsów API. DirectX i OpenGL to graficzne API, czyli Application Programming Interfaces - otwarte standardy kodu dostępne dla każdego.

Przed pojawieniem się graficznych interfejsów API każdy producent procesorów graficznych miał własny mechanizm komunikacji z grami. Deweloperzy musieli napisać osobny kod dla każdego GPU, który chcieli obsługiwać. Bardzo drogie i nieefektywne podejście. Aby rozwiązać ten problem, opracowano interfejsy API dla grafiki 3D, aby programiści pisali kod dla określonego interfejsu API, a nie dla tej czy innej karty graficznej. Następnie problemy ze zgodnością spadły na barki producentów kart graficznych, którzy musieli zadbać o to, aby sterowniki były kompatybilne z interfejsem API.

Jedyną komplikacją pozostaje to, że obecnie używane są dwa różne interfejsy API, a mianowicie Microsoft DirectX i OpenGL, gdzie GL oznacza bibliotekę graficzną (biblioteka graficzna). Ponieważ API DirectX jest obecnie bardziej popularne w grach, skupimy się na nim. I ten standard silniej wpłynął na rozwój gier.

DirectX jest powstanie Microsoftu. W rzeczywistości DirectX zawiera kilka interfejsów API, z których tylko jeden jest używany do grafiki 3D. DirectX zawiera interfejsy API dla dźwięku, muzyki, urządzeń wejściowych i nie tylko. Direct3D API odpowiada za grafikę 3D w DirectX. Kiedy mówią o kartach graficznych, dokładnie to mają na myśli, dlatego pod tym względem koncepcje DirectX i Direct3D są wymienne.

DirectX jest okresowo aktualizowany w miarę rozwoju technologii graficznej i wprowadzania przez twórców gier nowych technik programowania gier. Ponieważ popularność DirectX gwałtownie wzrosła, producenci procesorów graficznych zaczęli dostosowywać nowe wersje produktów do możliwości DirectX. Z tego powodu karty graficzne są często powiązane ze wsparciem sprzętowym jednej lub drugiej generacji DirectX (DirectX 8, 9.0 lub 9.0c).

Aby jeszcze bardziej skomplikować sprawę, części API Direct3D mogą zmieniać się w czasie bez zmiany generacji DirectX. Na przykład specyfikacja DirectX 9.0 określa obsługę Pixel Shader 2.0. Ale aktualizacja DirectX 9.0c zawiera Pixel Shader 3.0. Tak więc, chociaż karty należą do klasy DirectX 9, mogą obsługiwać różne zestawy funkcji. Na przykład Radeon 9700 obsługuje Shader Model 2.0, a Radeon X1800 obsługuje Shader Model 3.0, chociaż obie karty można sklasyfikować jako generację DirectX 9.

Pamiętaj, że tworząc nowe gry, twórcy biorą pod uwagę posiadaczy starych maszyn i kart graficznych, bo jeśli pominiesz ten segment użytkowników, to sprzedaż będzie niższa. Z tego powodu w grach wbudowanych jest wiele ścieżek kodu. Gra klasy DirectX 9 najprawdopodobniej będzie miała ścieżkę DirectX 8, a nawet ścieżkę DirectX 7. Zwykle po wybraniu starej ścieżki niektóre efekty wirtualne, które są na nowych kartach graficznych, znikają z gry. Ale przynajmniej możesz grać nawet na starym sprzęcie.

Wiele nowych gier wymaga zainstalowania najnowszej wersji DirectX, nawet jeśli karta graficzna pochodzi z poprzedniej generacji. Oznacza to, że nowa gra, która będzie korzystać ze ścieżki DirectX 8, nadal wymaga zainstalowania najnowszej wersji DirectX 9 na karcie graficznej klasy DirectX 8.

Jakie są różnice między różnymi wersjami interfejsu API Direct3D w DirectX? Wczesne wersje DirectX — 3, 5, 6 i 7 — były stosunkowo proste pod względem interfejsu API Direct3D. Deweloperzy mogli wybrać efekty wizualne z listy, a następnie sprawdzić ich pracę w grze. Kolejnym ważnym krokiem w programowaniu grafiki był DirectX 8. Wprowadził on możliwość programowania karty graficznej za pomocą shaderów, dzięki czemu po raz pierwszy programiści mieli swobodę programowania efektów tak, jak chcieli. Obsługiwane przez DirectX 8 Pixel Shader w wersjach od 1.0 do 1.3 i Vertex Shader 1.0. DirectX 8.1, zaktualizowana wersja DirectX 8, otrzymała Pixel Shader 1.4 i Vertex Shader 1.1.

W DirectX 9 możesz tworzyć jeszcze bardziej złożone programy do cieniowania. DirectX 9 obsługuje Pixel Shader 2.0 i Vertex Shader 2.0. DirectX 9c, zaktualizowana wersja DirectX 9, zawiera specyfikację Pixel Shader 3.0.

Będzie towarzyszyć DirectX 10, nadchodzące wydanie API Nowa wersja Windows Vista. Nie można zainstalować DirectX 10 w systemie Windows XP.

Oświetlenie HDR i OpenEXR HDR

HDR oznacza „High Dynamic Range”, wysoki zakres dynamiki. Gra z oświetleniem HDR może zapewnić znacznie bardziej realistyczny obraz niż gra bez niego, a nie wszystkie karty graficzne obsługują oświetlenie HDR.

Przed pojawieniem się kart graficznych klasy DirectX 9 procesory graficzne były poważnie ograniczone dokładnością obliczeń oświetlenia. Do tej pory oświetlenie można było obliczyć tylko przy użyciu 256 (8 bitów) poziomów wewnętrznych.

Kiedy pojawiły się karty graficzne klasy DirectX 9, były w stanie generować oświetlenie o wysokiej wierności - pełne 24 bity lub 16,7 miliona poziomów.

Dzięki 16,7 milionom poziomów i wykonaniu kolejnego kroku w wydajności karty graficznej klasy DirectX 9/Shader Model 2.0, oświetlenie HDR jest również możliwe na komputerach. Jest to dość złożona technologia i trzeba ją oglądać w dynamice. Mówiąc prościej, oświetlenie HDR zwiększa kontrast (ciemne odcienie wydają się ciemniejsze, jasne odcienie jaśniejsze), jednocześnie zwiększając ilość szczegółów oświetlenia w ciemnych i jasnych obszarach. Gra z oświetleniem HDR jest bardziej żywa i realistyczna niż bez niego.

Procesory graficzne zgodne z najnowszą specyfikacją Pixel Shader 3.0 umożliwiają bardziej precyzyjne 32-bitowe obliczenia oświetlenia, a także mieszanie zmiennoprzecinkowe. W ten sposób karty graficzne klasy SM 3.0 mogą obsługiwać specjalną metodę oświetlenia HDR OpenEXR, zaprojektowaną specjalnie dla przemysłu filmowego.

Niektóre gry, które obsługują tylko oświetlenie HDR przy użyciu metody OpenEXR, nie będą działać z oświetleniem HDR na kartach graficznych Shader Model 2.0. Jednak gry, które nie opierają się na metodzie OpenEXR, będą działać na dowolnej karcie graficznej DirectX 9. Na przykład Oblivion używa metody OpenEXR HDR i umożliwia włączenie oświetlenia HDR tylko na najnowszych kartach graficznych obsługujących specyfikację Shader Model 3.0. Na przykład nVidia GeForce 6800 lub ATi Radeon X1800. Gry korzystające z silnika Half-Life 2 3D, takie jak Counter-Strike: Source i nadchodzący Half-Life 2: Aftermath, umożliwiają włączenie renderowania HDR na starszych kartach graficznych DirectX 9, które obsługują tylko Pixel Shader 2.0. Przykłady obejmują linię GeForce 5 lub ATi Radeon 9500.

Na koniec pamiętaj, że wszystkie formy renderowania HDR wymagają dużej mocy obliczeniowej i mogą rzucić na kolana nawet najpotężniejsze procesory graficzne. Jeśli chcesz grać najnowsze gry przy oświetleniu HDR wydajna grafika jest niezbędna.

Pełnoekranowy antyaliasing

Pełnoekranowy antyaliasing (w skrócie AA) pozwala wyeliminować charakterystyczne „drabinki” na granicach wielokątów. Należy jednak pamiętać, że pełnoekranowy antyaliasing zużywa dużo zasobów obliczeniowych, co prowadzi do spadku liczby klatek na sekundę.

Wygładzanie jest bardzo zależne od wydajności pamięci wideo, więc szybka karta graficzna z szybką pamięcią będzie w stanie obliczyć antyaliasing na pełnym ekranie przy mniejszym wpływie na wydajność niż niedroga karta graficzna. Antyaliasing można włączyć w różnych trybach. Na przykład antyaliasing 4x zapewni lepszy obraz niż antyaliasing 2x, ale będzie to duży hit wydajności. Podczas gdy antyaliasing 2x podwaja rozdzielczość poziomą i pionową, tryb 4x zwiększa ją czterokrotnie.

Filtrowanie tekstur

Wszystkie obiekty 3D w grze są teksturowane, a im większy kąt wyświetlanej powierzchni, tym bardziej zniekształcona będzie tekstura. Aby wyeliminować ten efekt, procesory graficzne używają filtrowania tekstur.

Pierwsza metoda filtrowania została nazwana dwuliniową i dawała charakterystyczne, niezbyt przyjemne dla oka pasy. Sytuacja poprawiła się wraz z wprowadzeniem filtrowania trójliniowego. Obie opcje na nowoczesnych kartach graficznych działają praktycznie bez pogorszenia wydajności.

Na dzisiaj najbardziej Najlepszym sposobem filtrowanie tekstur to filtrowanie anizotropowe (AF). Podobnie jak w przypadku FSAA, filtrowanie anizotropowe można włączyć na różnych poziomach. Na przykład 8x AF zapewnia lepszą jakość filtrowania niż 4x AF. Podobnie jak FSAA, filtrowanie anizotropowe wymaga pewnej mocy obliczeniowej, która wzrasta wraz ze wzrostem poziomu AF.

Tekstury w wysokiej rozdzielczości

Wszystkie gry 3D są budowane zgodnie z określonymi specyfikacjami, a jeden z tych wymagań określa pamięć tekstur, której będzie potrzebować gra. Wszystkie niezbędne tekstury muszą pasować do pamięci karty graficznej podczas gry, w przeciwnym razie wydajność znacznie spadnie, ponieważ prośba o teksturę w Baran powoduje znaczne opóźnienie, nie mówiąc już o pliku stronicowania na dysku twardym. Dlatego jeśli twórca gry oczekuje 128 MB pamięci wideo jako Minimalne wymagania, to zestaw aktywnych tekstur nie może w żadnym momencie przekroczyć 128 MB.

Nowoczesne gry mają wiele zestawów tekstur, więc gra będzie działać płynnie na starszych kartach graficznych z mniejszą ilością VRAM, jak również na nowszych kartach z większą ilością VRAM. Na przykład gra może zawierać trzy zestawy tekstur: dla 128 MB, 256 MB i 512 MB. Obecnie jest bardzo niewiele gier obsługujących 512 MB pamięci wideo, ale nadal są one najbardziej obiektywnym powodem zakupu karty graficznej z taką ilością pamięci. Chociaż wzrost pamięci ma niewielki lub żaden wpływ na wydajność, uzyskasz poprawę jakości wizualnej, jeśli gra obsługuje odpowiedni zestaw tekstur.

Co warto wiedzieć o kartach wideo?

W kontakcie z

Być może teraz te bloki są głównymi częściami układu wideo. Wykonują specjalne programy zwane shaderami. Co więcej, jeśli wcześniejsze pikselowe shadery wykonywały bloki pikselowych cieniowania, a wierzchołków - bloki wierzchołków, to od pewnego czasu architektury graficzne zostały ujednolicone, a te uniwersalne bloki obliczeniowe zostały zaangażowane w różne obliczenia: wierzchołkowe, pikselowe, geometryczne, a nawet uniwersalne. .

Po raz pierwszy w chipie wideo konsoli do gier zastosowano zunifikowaną architekturę. Microsoft Xbox 360, ten procesor graficzny został opracowany przez ATI (później zakupiony przez AMD). I w układach wideo dla komputery osobiste ujednolicone jednostki cieniujące pojawiły się na płycie NVIDIA GeForce 8800. Od tego czasu wszystkie nowe układy wideo są oparte na ujednoliconej architekturze, która ma uniwersalny kod dla różnych programów cieniujących (werteks, piksel, geometryczny itp.) oraz odpowiadające im ujednolicone procesory może wykonywać dowolne programy.

Na podstawie liczby jednostek obliczeniowych i ich częstotliwości można porównać matematyczną wydajność różnych kart graficznych. Większość gier jest teraz ograniczona przez wydajność shaderów pikseli, więc liczba tych bloków jest bardzo ważna. Na przykład, jeśli jeden model karty graficznej jest oparty na GPU z 384 procesorami obliczeniowymi w swoim składzie, a inny z tej samej linii ma GPU ze 192 jednostkami obliczeniowymi, to przy tej samej częstotliwości drugi będzie dwukrotnie wolniejszy do przetworzyć dowolny typ modułu cieniującego i ogólnie będzie tak samo bardziej produktywny.

Chociaż nie można wyciągnąć jednoznacznych wniosków na temat wydajności wyłącznie na podstawie liczby jednostek obliczeniowych, konieczne jest uwzględnienie częstotliwości taktowania i różnej architektury bloków różnych generacji i producentów chipów. Same te liczby mogą posłużyć do porównania układów z tej samej linii jednego producenta: AMD lub NVIDIA. W innych przypadkach należy zwrócić uwagę na testy wydajności w interesujących grach lub aplikacjach.

Jednostki teksturujące (TMU)

Te jednostki GPU współpracują z procesorami obliczeniowymi w celu próbkowania i filtrowania tekstur oraz innych danych potrzebnych do tworzenia scen i obliczeń ogólnego przeznaczenia. Liczba jednostek tekstury w chipie wideo określa wydajność tekstury - to znaczy szybkość, z jaką teksele są pobierane z tekstur.

Chociaż ostatnio większy nacisk położono na obliczenia matematyczne, a niektóre tekstury zostały zastąpione proceduralnymi, obciążenie TMU jest nadal dość duże, ponieważ oprócz głównych tekstur, próbki muszą być również tworzone z map normalnych i map przemieszczeń, ponieważ jak również bufory renderowania celu renderowania poza ekranem.

Biorąc pod uwagę nacisk, jaki kładzie się w wielu grach, w tym na wydajność jednostek teksturujących, możemy powiedzieć, że liczba jednostek TMU i odpowiadająca im wysoka wydajność tekstur również należą do najważniejsze parametry dla układów wideo. Ten parametr ma szczególny wpływ na szybkość renderowania obrazu podczas korzystania z filtrowania anizotropowego, które wymaga dodatkowego pobierania tekstur, a także w przypadku złożonych algorytmów miękkiego cienia i nowomodnych algorytmów, takich jak Screen Space Ambient Occlusion.

Jednostki operacji rasteryzacji (ROP)

Jednostki rasteryzacji wykonują operacje zapisu pikseli obliczonych przez kartę graficzną do buforów oraz operacje ich miksowania (blendingu). Jak zauważyliśmy powyżej, wydajność jednostek ROP wpływa na szybkość wypełniania i jest to jedna z głównych cech kart graficznych wszechczasów. I choć w ostatnim czasie jego wartość również nieco spadła, wciąż zdarzają się przypadki, w których wydajność aplikacji zależy od szybkości i liczby ROP-ów. Najczęściej wynika to z aktywnego korzystania z filtrów post-processingu i antyaliasingu włączonego przy wysokich ustawieniach gry.

Architektura GPU: funkcje

Realizm grafiki 3D jest bardzo zależny od wydajności karty graficznej. Im więcej bloków Pixel Shader zawiera procesor i im wyższa częstotliwość, tym więcej efektów można zastosować do sceny 3D, aby poprawić jej percepcję wizualną.

GPU zawiera wiele różnych bloków funkcjonalnych. Na podstawie liczby niektórych komponentów można oszacować, jak potężny jest procesor graficzny. Zanim przejdziemy dalej, przyjrzyjmy się najważniejszym blokom funkcjonalnym.

Procesory wierzchołków (jednostki cieniowania wierzchołków)

Podobnie jak moduły cieniujące piksele, procesory wierzchołków wykonują kod modułu cieniującego, który dotyka wierzchołków. Ponieważ większy budżet wierzchołków umożliwia tworzenie bardziej złożonych obiektów 3D, wydajność procesorów wierzchołków jest bardzo ważna w scenach 3D zawierających złożone lub duże liczby obiektów. Jednak jednostki cieniujące wierzchołki nadal nie mają tak oczywistego wpływu na wydajność, jak procesory pikselowe.

Procesory pikseli (cieniowanie pikseli)

Procesor pikselowy jest elementem układu graficznego przeznaczonym do przetwarzania programów cieniujących piksel. Procesory te wykonują obliczenia odnoszące się wyłącznie do pikseli. Ponieważ piksele zawierają informacje o kolorze, moduły cieniujące piksele mogą osiągnąć imponujące efekty graficzne. Na przykład większość efektów wodnych, które można zobaczyć w grach, jest tworzonych przy użyciu shaderów pikseli. Zazwyczaj liczba procesorów pikseli jest używana do porównania wydajności pikseli kart graficznych. Jeśli jedna karta jest wyposażona w osiem jednostek cieniowania pikseli, a druga w 16 jednostek, to całkiem logiczne jest założenie, że karta graficzna z 16 jednostkami będzie szybciej przetwarzać złożone programy pikseli. Należy również wziąć pod uwagę szybkość zegara, ale obecnie podwojenie liczby procesorów pikselowych jest bardziej wydajne pod względem zużycia energii niż podwojenie częstotliwości układu graficznego.

Ujednolicone shadery

Zunifikowane (pojedyncze) shadery nie zawitały jeszcze w świecie PC, ale nadchodzący standard DirectX 10 opiera się na podobnej architekturze. Oznacza to, że struktura kodu programów wierzchołkowych, geometrycznych i pikselowych będzie taka sama, chociaż shadery będą wykonywać inną pracę. Z nową specyfikacją można zapoznać się na konsoli Xbox 360, gdzie układ graficzny został zaprojektowany przez firmę ATi dla firmy Microsoft. Bardzo ciekawie będzie zobaczyć, jaki potencjał niesie ze sobą nowy DirectX 10.

Jednostki mapowania tekstury (TMU)

Tekstury należy wybrać i przefiltrować. Ta praca jest wykonywana przez jednostki mapowania tekstur, które działają w połączeniu z jednostkami cieniującymi piksele i wierzchołki. Zadaniem TMU jest zastosowanie operacji na teksturach do pikseli. Liczba jednostek tekstur w GPU jest często używana do porównywania wydajności tekstur kart graficznych. Całkiem rozsądne jest założenie, że karta graficzna z większą liczbą jednostek TMU zapewni lepszą wydajność tekstur.

Raster Operator Unit (ROP)

Procesory RIP są odpowiedzialne za zapisywanie danych pikseli w pamięci. Szybkość, z jaką wykonywana jest ta operacja, jest szybkością napełniania. We wczesnych latach akceleratorów 3D ROP i współczynniki wypełnienia były bardzo ważnymi cechami kart graficznych. Dziś praca ROP jest nadal ważna, ale wydajność karty graficznej nie jest już ograniczona tymi blokami, jak to było kiedyś. Dlatego wydajność (i liczba) ROP jest rzadko używana do oceny szybkości karty graficznej.

przenośniki

Potoki są używane do opisywania architektury kart graficznych i dają bardzo wizualną reprezentację wydajności procesora graficznego.

Przenośnik nie może być uważany za ściśle techniczny termin. GPU używa różnych potoków, które wykonują różne funkcje. W przeszłości potok był rozumiany jako procesor pikseli, który był podłączony do własnej jednostki mapowania tekstur (TMU). Na przykład karta graficzna Radeon 9700 wykorzystuje osiem procesorów pikseli, z których każdy jest podłączony do własnego TMU, więc uważa się, że karta ma osiem potoków.

Ale bardzo trudno jest opisać nowoczesne procesory liczbą potoków. W porównaniu z poprzednimi konstrukcjami, nowe procesory wykorzystują modułową, fragmentaryczną strukturę. ATi można uznać za innowatora w tej dziedzinie, który wraz z linią kart graficznych X1000 przeszedł na strukturę modułową, co umożliwiło osiągnięcie wzrostu wydajności poprzez wewnętrzną optymalizację. Niektóre bloki procesora są używane częściej niż inne, a aby poprawić wydajność GPU, ATi próbowało znaleźć kompromis między liczbą potrzebnych bloków a obszarem matrycy (nie można go zbytnio zwiększyć). W tej architekturze termin „potok pikseli” stracił już swoje znaczenie, ponieważ procesory pikseli nie są już podłączone do własnych TMU. Na przykład procesor graficzny ATi Radeon X1600 ma 12 shaderów pikseli i łącznie cztery jednostki TMU. Dlatego nie można powiedzieć, że w architekturze tego procesora jest 12 potoków pikselowych, tak jak nie można powiedzieć, że jest ich tylko cztery. Jednak zgodnie z tradycją nadal wspomina się o potokach pikselowych.

Mając na uwadze te założenia, liczba potoków pikseli w GPU jest często używana do porównywania kart graficznych (z wyjątkiem linii ATi X1x00). Na przykład, jeśli weźmiemy karty graficzne z 24 i 16 potokami, całkiem rozsądne jest założenie, że karta z 24 potokami będzie szybsza.


TREŚĆ

Co zostanie omówione w tym krótkim artykule?

Ten artykuł to zestaw podstawowej wiedzy dla tych, którzy chcą wybrać zrównoważoną kartę graficzną bez dawania dodatkowych pieniędzy marketerom. Pomoże początkującym, jak również posłuży jako źródło przydatnych informacji dla bardziej zaawansowanych użytkowników PC. Niemniej jednak mini artykuł nadal koncentruje się konkretnie dla początkujących.

Przeznaczenie karty wideo

Nie jest tajemnicą, że w naszych czasach głównym obszarem działania wydajnej karty graficznej jest - 3 Dgry, płynna gra wideo( Jakość HD ), praca w zawodzie 3D2D i edytorów wideo. Resztę codziennych zadań można wykonywać bez problemów na kartach graficznych wbudowanych w procesor lub chipset. Ostatnio w przypadku karty graficznej pole działania zostało rozszerzone w formie obliczenia wielowątkowe, które działają znacznie szybciej na równoległej architekturze kart graficznych niż na procesorach.

NVIDIApromuje swoje oprogramowanie i platformę sprzętowąCUDAna podstawie języka Xi (nawiasem mówiąc, z powodzeniem, i nie jest to zaskakujące, przy inwestowaniu takich środków).AMDto samo, opiera się głównie na open sourceOpenCL.

Używając możesz kodować wideo 3-4 razy szybciej. Sprzęt, karty graficzne do przyspieszenia produktów firmyCegła suszona na słońcu- w szczególności Photoshop, Błyski wydaje się, że to dopiero początek. To prawda, ci ludzie, którzy stale używają moc obliczeniowa karty graficzne, teoretycznie bardzo nieliczne. I wydawało się, że jest za wcześnie, aby o tym myśleć, zwłaszcza że depczą im po piętach dużojądrowy procesory, które choć wolniejsze w operacjach wielowątkowych, mają niezaprzeczalną zaletę polegającą na tym, że po prostu wykonują swoją pracę bez skomplikowanych optymalizacji oprogramowania. Oraz prostota i łatwość wdrożenia, jak pokazuje historiaOkna(na przykład) - dla ludzi najważniejsze i klucz do sukcesu w Oprogramowanie rynek. A mimo to warto oddać hołd mocy obliczeniowej kart graficznych, której jeszcze nie ograniczyło „poprawne” oprogramowanie.

Więc. NVIDIALubAMD?

*Najciekawsze pytanie

Korporacje są głównymi graczami na rynku akceleratorów graficznych.AMD I NVIDIA.


Tutaj wszystko jest jasne, jak w wielu sektorach rynków, duopol. Jak pepsi I Coca-Cola, tak jak Xbox 360 , Jak Intel I AMD na końcu. Ostatnio firmy wypuszczają swoje produkty jeden po drugim. Potem tak, żeby jeden był dobry, a drugi. Najpierw AMD wypuszcza okręt flagowy linii, a następnie po dwóch lub trzech miesiącach wypuszcza mocniejszy okręt flagowy NVIDIA. Najpierw kup karty AMD, jako najpotężniejszy, a następnie po wydaniu kart NVIDIA kto je kupił wraca do sklepu po jeszcze lepszy produkt. Niemal to samo dzieje się ze średnim i budżetowym rynkiem. Tylko różnica w zwiększonej wydajności w stosunku do konkurenta jest tutaj wyższa, ponieważ aby zainteresować bardziej ekonomicznego konsumenta, potrzeba więcej niż szansy na lepszą kartę graficzną, jak to ma miejsce w sektorze flagowym.

Lepiej nie „fanatować”, bo to biznes, a nie nic osobistego. Najważniejsze, że karty graficzne są produktywne, a ceny nie gryzą. A który producent nie jest ważny. Dzięki takiemu podejściu zawsze możesz wygrać pod względem wydajności cenowej.

Architektura chipa.

Ilośćprocesory pikseli (dla AMD ), przenośniki uniwersalne (Dla NVIDIA).

Tak. To są zupełnie różne rzeczy. Co ma AMD Radeon Jakość HD 5870 1600 jednostek wykonawczych wcale nie oznacza, że ​​będzie 3 razy mocniejszy niżNVIDIA GTX 480 który ma na pokładzie 480 bloki wykonawcze.

NVIDIATo ma skalarny architektura iAMDsuperskalarny .

architektury AMD.

Rozważ architekturę PP (*procesory pikseli),na przykładzie podstawowej architektury superskalarnej kart graficznychRadeon Jakość HD 5 odcinków ( VLIW 5-kierunkowy).


Każdy 5 str tworzą jedną jednostkę wykonawczą, która może wykonać maksymalnie na raz - 1 skalar operacja i 1 wektor lub czasami 5 skalarnych(jednak warunki nie zawsze są do tego odpowiednie). Każda operacja na wektorach wymaga 4 str, każdy skalar 1 pp. A tutaj, jak to się potoczy. NaNVIDIA to samo, każdy Rdzeń Cudy, wykonuje ściśle wg 1 wektor I 1 skalar operacji na zegar.

Wraz z wydaniem odcinka 6, o nazwie kodowej ( Wyspy Północne ), czyli żetony Cayman, postanowił zrezygnować z dodatkowej, piątejaluminium(jednostka T), który był odpowiedzialny za realizację skomplikowanych zadań.

Teraz tę rolę mogą pełnić trzy z czterech pozostałych bloków. Pozwoliło to na rozładowanie menedżera wątków ( Ultra-wątkowy procesor wysyłki), które dodatkowo zostały zdublowane w celu usprawnienia pracy z geometrią i teselacją, które były słabą stroną serii 5. Ponadto pozwala zaoszczędzić na obszarze rdzenia i budżecie tranzystorów przy tej samej wydajności.

Po szóstej serii pracuj nad rozwojem VLIW zakończyło się, ze względu na małą elastyczność i duże przestoje spowodowane zależnościami bloków wewnętrznych od siebie (zwłaszcza operacje wektorowe). Na pierwszy plan wysunęła się zupełnie nowa architektura Rdzeń graficzny następny .

silnik SIMD, jest zastępowane przez jednostkę obliczeniową Jednostka obliczeniowa (CU), co pozwala znacznie podnieść poziom wydajności i wydajności architektury. Każdy PC może teraz niezależnie wykonywać operacje wektorowe i skalarne, gdyż wprowadzono dla nich osobne bloki sterujące, które wydajniej rozdzielają zasoby pomiędzy wolne bloki. Ogólnie rzecz biorąc, architektura zaczyna przejmować niektóre założenia architektury skalarnej NVIDIA co jest proste i skuteczne.

Pierwszy chip z nową architekturą był GPU Tahiti na których budują AMD Radeona HD 7970/7950 . Firma planuje wypuścić na nową architekturę także klasę średnią.

Teraz rozważ podstawowe architektura skalarna NVIDIA .


Jak widać, każdy procesor uniwersalny ( ) na wykonanie rytmu 1 operacja skalarna i 1 wektor. Pozwala to osiągnąć maksymalną gładkość. Tam, gdzie jest wiele operacji wektorowych i skalarnych, karty graficzneAMD z architekturą VLIWgorsze, ponieważ nie są w stanie załadować swoich bloków jako kart graficznychNVIDIA.

Załóżmy, że wybór padł pomiędzyRadeona HD 5870 I GeForce GTX 480 .

Pierwszy 1600 pp, drugi 480 ujednolicone bloki.

Oblicz: 16005=320 bloków superskalarnych, y Radeona HD5870.

To znaczy na cykl karta graficzna zAMD, wykonuje od 320 do 1600 operacje skalarne i od 0 do 320 wektor pływający, w zależności od charakteru problemu.

A przy podwójnej częstotliwości domeny modułu cieniującego mapa na architekturzeFermiego, teoretycznie powinien spełniać 960 wektor i 960 operacji skalarnych na cykl.

Jednakże Radeon , ma korzystniejszą częstotliwość niż karta z „zielonego obozu” (700 vs. 850). A więc te liczbyNVIDIA, teoretycznie powinny być takie same jak wtedy, gdy domena shaderów działa na częstotliwości 1700 MHz (850 X 2=1700), ale tak nie jest. Na częstotliwości 1401 MHz, GTX 480 produkuje ~ 700 wektor i ~ 700 operacji skalarnych na cykl.

* nie polegaj na wiarygodności tych obliczeń, są one tylko teoretyczne. Ponadto to stwierdzenie nie obowiązuje od 6. serii Radeon zaczynając od chipsów Kajman.

W związku z faktem, że maksymalna ilość operacje wektorowe i skalarne są wykonywane na tej samej liczbie, architekturzeNVIDIAma najlepsze gładkość w trudnych scenach niż AMD VLIW (<5 series).

Kategorie cenowe i co otrzymamy, jeśli kupimy kartę graficzną młodszej serii.

Inżynierowie AMD, bez wahania wycięli połowę procesorów pikselowych, szynę pamięci i częśćRPO'S generacji kart, od segmentu do klasy poniżej. NpRadeona HD5870 To ma 1600 pp, opona 256 fragment, i w 577 0, dokładnie połowa pozostaje - 800 i magistrali pamięci 128 fragment. Ta sama sytuacja dotyczy najbardziej budżetowych kart graficznych. Dlatego zawsze lepiej będzie kupić słabszą kartę graficzną z serii 58** niż najstarszą z serii 57**.

Inżynierowie NVIDIAniewiele różniące się podejście. Gładka, przycięta magistrala pamięci, uniwersalne potoki,RPO'S , potoki pikseli. Ale spadają też częstotliwości, co przy odpowiednim układzie chłodzenia można nieco zrekompensować podkręcaniem. To trochę dziwne, że nie jest na odwrót, tak jak ma to miejsceAMD, zwiększając częstotliwości na kartach z odciętą liczbą siłowników.

Podejście AMD bardziej korzystne dla producenta podejście NVIDIA- do kupującego.

Wzmianka o kierowcach.

Dzieje się tak właśnie ze względu na cechy architektury superskalarnej VLIW, kierowcy z AMD, musisz stale optymalizować, aby karta wideo rozumiała, kiedy musi używać wektorów lub skalarów tak wydajnie, jak to możliwe.

Ujednolicone sterowniki zNVIDIAbardziej odporny na różne silniki gier ze względu na fakt, że inżynierowieNVIDIAczęsto już podczas tworzenia gry optymalizują ją pod kątem architektury swoich układów graficznych i sterowników. Warto również zauważyć, że podczas ich instalowania i usuwania praktycznie nie ma problemów związanych ze sterownikamiAMD.

Kierowcy NVIDIA można zainstalować bezpośrednio na starych, bez usuwania i czyszczenia rejestru. Mamy nadzieję, że programiściAMDruszy w tym samym kierunku. Teraz możesz pobrać „poprawki” dla sterownikówKatalizator, które wydawane są na krótko przed premierą gry w sprzedaży lub nieco później. Już coś. I wraz z wydaniem nowej architektury Rdzeń graficzny następny, praca nad optymalizacją sterowników będzie znacznie ułatwiona.

potoki pikselowe, TMU, RPO.

Bardzo ważny jest też numer. potoki pikseli I TMU (blok nakładki tekstury), ich liczba jest szczególnie ważna przy wysokich rozdzielczościach i przy stosowaniu anizotropowego filtrowania tekstur ( potoki pikseli są ważne), przy użyciu wysokiej jakości tekstur i wysokich ustawień filtrowania anizotropowego (ważne TMU).

Liczba blokówRPO (bloki operacji rastrowych ), wpływają głównie na wydajność antyaliasingu, ale ich brak może spowodować utratę ogólnej wydajności. Im ich więcej, tym bardziej dyskretnie antyaliasing wpłynie na liczbę klatek na sekundę. Ponadto na wydajność antyaliasingu znacząco wpływa ilość pamięci wideo.

Głośność, częstotliwość i szerokość bitowa magistrali pamięci.

Im więcej pamięci wideo ma karta wideo, tym lepiej. Jednak nie warto kupować hurtowo.

Jak to często bywa, na stosunkowo słabych kartach graficznych umieszczają niewiarygodne ilości pamięci wideo, a nawet wolno (na przykład naGeForce 8500GT, Niektóre OEMstawiają producenci 2 GB NRD2 pamięć wideo). Z tego powodu karta wideo nie wystartuje, a wydajność nie zostanie dodana.

*w porównaniu do 8500 GT 512mb

Znacznie lepszą opcją byłoby uzyskanie karty graficznej z szybszą pamięcią, ale mniejszą głośnością. Na przykład, jeśli wybór brzmi: weź 9800 GTZ 512 Lub 1024 MB pamięci z częstotliwością 1000MHz I 900MHz w związku z tym lepiej byłoby wziąć 9800 GT Z 512 MB pamięć. Co więcej, karta graficzna tego poziomu nie potrzebuje więcej pamięci wideo 512 MB.

Przepustowość pamięci - to jest najważniejsze w wydajności podsystemu pamięci wideo, co najważniejsze wpływa na wydajność karty graficznej jako całości. Mierzona w Gb/s (gigabajtach na sekundę).

Na przykład pamięć wideo typuRODO5 , który ma znacznie wyższy potencjał częstotliwości niżRODO3 i odpowiednio bielszy wysoki wydajność.

Częstotliwość to jednak nie wszystko. Drugim ważnym czynnikiem jest szerokość szyny pamięci. Im większa głębia bitowa, tym szybsza pamięć.

Na przykład pamięć z częstotliwością 1000MHz i autobus 256 fragment, będzie dokładnie 2 razy szybciej pamięć 1000MHz i autobus 128 fragment. Im większa głębia bitowa, tym szybsza pamięć. Najszersza istniejąca szyna pamięci jest potworna 896 fragment(448 X2 ) na karcie graficznej GeForce GTX295 . Wykorzystuje jednak pamięćRODO3 , co znacznie obniża przepustowość (mniej efektywnej częstotliwości) w porównaniu doRODO5 . Dlatego jego przepustowość jest nawet nieco niższa niż w przypadkuRadeona HD 5970 Z 512 fragment(256 x 2), ale z RODO5 .

System chłodzenia.

Im wydajniejszy system chłodzenia, tym mniejsza szansa na awarię karty graficznej. Karta przegrzeje się mniej, co znacznie poprawi ogólną stabilność systemu dożywotni, jak również wzrost potencjał przetaktowywania.

Wyprodukowany, gotowyZsystemy O chłodzące karty graficzne występują w dwóch wersjach.



Odniesienie (od producenta) i alternatywny (od partnerów producenta). Z reguły karty referencyjne mają konstrukcję turbiny (dmuchawy) i są zwykle bardzo niezawodne. Stosunkowo głośny, nie zawsze tak wydajny jak alternatywny WIĘC od partnerów producenta i są bardziej zapchane kurzem. Chociaż używane systemy chłodzenia dmuchawami dla kart graficznych są bardzo wydajne i ciche. Jeśli nie przeszkadza ci trochę hałasu pod obciążeniem i nie będziesz bił rekordów w podkręcaniu, preferowane są referencyjne systemy chłodzenia. Zwykle partnerzy producentów przyklejają je naklejkami z ich logotypami, zmiany są możliwe tylko w BIOS-ie karty graficznej (regulacja prędkości wentylatora), więc niektóre karty są identyczne pod względem konstrukcji, ale różnych producentów, głośniejsze lub gorętsze niż ich odpowiedniki i nawzajem. Każdy producent ma swoje preferencje i warunki gwarancji. Dlatego niektórzy poświęcają ciszę dla większej stabilności i trwałości.



Jeśli to dla Ciebie ważne cisza, warto zwrócić na to uwagę systemy alternatywne chłodzenie o podwyższonej wydajności, przy niższym poziomie hałasu (npVapor-x, IceQ, , DirectCu) lub wybierz kartę graficzną z pasywnym systemem chłodzenia, których jest teraz coraz więcej.

* Rada: nie zapomnij zmienić interfejsu termicznego raz na rok lub dwa, zwłaszcza na CO z technologią bezpośredniego kontaktu z rurką cieplną. Pasta termoprzewodząca twardnieje, tworząc warstwę słabo przewodzącą ciepło, co prowadzi do przegrzania karty graficznej.

Pobór mocy karty graficznej.

Bardzo ważna cecha przy wyborze, ponieważ karta graficzna jest bardzo żarłocznym elementem komputera, jeśli nie najbardziej żarłocznym. Najlepsze karty graficzne czasami zbliżają się do znaku 300 W. Dlatego przy wyborze należy wziąć pod uwagę, czy zasilacz jest w stanie zapewnić stabilne zasilanie karty graficznej. W przeciwnym razie system może się nie uruchomić z powodu niedopasowania napięcia podczas przechodzenia POST, może dojść do niestabilności działania i nieoczekiwanych wyłączeń, restartów lub przegrzania elementów komputera lub po prostu zasilacz może się spalić.

Na stronie internetowej producenta lub na pudełku karty graficznej zapisane są minimalne parametry, w tym minimalna moc zasilacza. Te wartości są zapisywane dla dowolnych bloków, w tym chińskich. Jeśli jesteś pewien, że masz wysokiej jakości zasilacz, możesz odjąć tę wartość 50-100 W.

Możesz pośrednio określić zużycie energii na podstawie liczby dodatkowych złączy zasilania na karcie graficznej.

Brak - mniej 75 W, jeden 6-stykowy zanim 150 W, dwa 6-stykowy zanim 225 W, 8-stykowy + 6-stykowy - zanim 300 W. Upewnij się, że Twój blok ma niezbędne złącza lub że w zestawie znajdują się przejściówki 4-pinowe moleks-S. Lub kup je dodatkowo, są swobodnie sprzedawane w sklepach komputerowych.

Brak zasilania karty graficznej może prowadzić do jej przegrzania, pojawienia się artefaktów i awarii systemu zasilania. Karty wideo NVIDIA, jeśli brakuje zasilania, mogą zacząć ostrzegać komunikatami typu: „sterownik wideo przestał odpowiadać i został przywrócony” lub „podłącz dodatkowe zasilanie do karty graficznej”.

Wysoki pobór mocy = wysokie rozpraszanie ciepła. Jeśli Twoja karta wideo zużywa dużo energii, zadbaj o dodatkowe wentylatory do wlotu i wylotu na obudowie. Lub tymczasowo otwórz pokrywę boczną. Stale wysoka temperatura w obudowie - niekorzystnie wpływa na linie serwisowe wszystkich podzespołów, od płyty głównej po.

Złącza.

Kiedy już zdecydowałeś się na kartę graficzną, należy zwrócić uwagę na złącza.


Jeśli masz monitor z matrycą P- lub ze wsparciem 30-bitowy kolor (1,07 miliarda), to na pewno będziesz potrzebować port wyświetlacza na karcie graficznej, aby uwolnić jej potencjał. Tylko port wyświetlacza obsługuje transmisję 30 bitów głębia koloru.

* nie wiadomo na pewno, czy karty graficzne do gier obsługują transmisję 30-bitową, ale obecność port wyświetlacza mówi o możliwym wsparciu. W specyfikacjach deklarowana jest obsługa tylko profesjonalnych kart graficznych AMD Fire Pro I NVIDIA Quadro.

Bardzo dobrze, jeśli tam . Nigdy nie wiadomo, co może się przydać i najlepiej być na to przygotowanym. Nagle musisz wyprowadzić sygnał z odbiornika. Przy okazji, HDMI I DVI kompatybilne za pomocą prostego adaptera i praktycznie bez problemów.

Wnioski.

To wszystko. Jeszcze nawet nie zaczęliśmy, już skończyliśmy. Ponieważ artykuł opisuje główne, ogólne pojęcia, okazał się niezbyt długi.

Niemniej jednak opisano wszystkie najważniejsze punkty dotyczące wyboru wysokiej jakości i wydajnej karty graficznej.

1. Kwestia wiary.

3. Liczba jednostek wykonawczych (TMU, ROP itp.).

4. Objętość, częstotliwość i szerokość szyny pamięci.

5. Sprawdź, czy karta jest odpowiednia do poziomu zużycia energii.

5. Układ chłodzenia.

6. Złącza.

Mamy nadzieję, że dzięki tej wiedzy będziesz mógł wybrać kartę wideo zgodnie ze swoimi wymaganiami.

Powodzenia z twoim wyborem!