Die Anzahl der Recheneinheiten (Shader) oder Prozessoren. Grafikkarte, wie man wählt. FAQ zu Eigenschaften bei der Auswahl einer Grafikkarte. Technologien, Merkmale von Herstellern und Architekturen, Kühlsysteme Anzahl der Shader-Prozessoren

In unserem Forum fragen täglich Dutzende Menschen nach Ratschlägen zur Modernisierung ihrer Maschinen, bei denen wir ihnen gerne weiterhelfen. Jeden Tag, als wir die Baugruppe „bewerteten“ und die von unseren Kunden ausgewählten Komponenten auf Kompatibilität überprüften, stellten wir fest, dass die Benutzer hauptsächlich auf andere, zweifellos wichtige Komponenten achten. Und selten erinnert sich jemand daran, dass beim Aufrüsten eines Computers ein ebenso wichtiger Teil aktualisiert werden muss –. Und heute verraten und zeigen wir, warum Sie das nicht vergessen sollten.

„...Ich möchte meinen Computer so aufrüsten, dass alles fliegt. Ich habe einen i7-3970X und ein ASRock X79 Extreme6-Motherboard sowie eine RADEON HD 7990 6GB-Grafikkarte gekauft. Was ist sonst noch Nan????777"
- So beginnen etwa die Hälfte aller Meldungen zum Thema Update eines Desktop-Computers. Basierend auf ihrem oder ihrem Familienbudget versuchen Benutzer, die schnellsten, schnellsten und schönsten Speichermodule auszuwählen. Gleichzeitig glauben sie naiv, dass ihr altes 450-W-Modell beim Übertakten gleichzeitig mit einer stromhungrigen Grafikkarte und einem „heißen“ Prozessor zurechtkommt.

Wir für unseren Teil haben bereits mehrfach über die Bedeutung der Stromversorgung geschrieben – aber wir gestehen, es war wahrscheinlich nicht klar genug. Deshalb haben wir uns heute korrigiert und für Sie eine Erinnerung daran vorbereitet, was passiert, wenn Sie es beim Aufrüsten Ihres PCs vergessen – mit Bildern und ausführlichen Beschreibungen.

Deshalb haben wir beschlossen, die Konfiguration zu aktualisieren ...


Für unser Experiment haben wir uns entschieden, einen völlig neuen Durchschnittscomputer zu nehmen und ihn auf das Niveau einer „Spielmaschine“ aufzurüsten. An der Konfiguration muss man nicht viel ändern – es reicht aus, den Speicher und die Grafikkarte auszutauschen, damit wir die Möglichkeit haben, mehr oder weniger moderne Spiele mit ordentlichen Detaileinstellungen zu spielen. Die Erstkonfiguration unseres Computers ist wie folgt:

Netzteil: ATX 12V 400W

Es ist klar, dass diese Konfiguration für Spiele, gelinde gesagt, eher schwach ist. Es ist also Zeit, etwas zu ändern! Wir beginnen mit dem Gleichen, mit dem die meisten derjenigen beginnen, die ein „Upgrade“ wollen – mit. Das Mainboard werden wir nicht wechseln – solange es uns passt.

Da wir uns entschieden haben, das Motherboard nicht anzufassen, werden wir eines auswählen, das mit dem FM2-Sockel kompatibel ist (zum Glück gibt es dafür auf der NICS-Website auf der Motherboard-Beschreibungsseite einen speziellen Button). Seien wir nicht gierig – nehmen wir einen bezahlbaren, aber schnellen und leistungsstarken Prozessor mit einer Frequenz von 4,1 GHz (bis zu 4,4 GHz im Turbo-CORE-Modus) und einem freigeschalteten Multiplikator – wir übertakten auch gerne, uns ist nichts Menschliches fremd. Hier sind die Eigenschaften des von uns ausgewählten Prozessors:

Eigenschaften
CPU-Busfrequenz 5000 MHz Energieverschwendung 100 W Prozessorfrequenz 4,1 GHz oder bis zu 4,4 GHz im Turbo CORE-Modus Kern Richland L1-Cache 96 KB x2 L2-Cache 2048 KB x2, läuft mit Prozessorgeschwindigkeit 64-Bit-Unterstützung Ja Anzahl der Kerne 4 Multiplikation 41, freigeschalteter Multiplikator Prozessor-Videokern AMD Radeon HD 8670D mit einer Frequenz von 844 MHz; Shader Model 5-Unterstützung Maximale RAM-Kapazität 64 GB Max. Anzahl der angeschlossenen Monitore 3 direkt angeschlossene oder bis zu 4 Monitore über DisplayPort-Splitter

Ein 4-GB-Stick ist nicht unsere Wahl. Erstens wollen wir 16 GB, und zweitens müssen wir den Dual-Channel-Betriebsmodus verwenden, für den wir zwei Speichermodule mit jeweils 8 GB in unseren Computer einbauen. Hoher Durchsatz, fehlende Heizkörper und ein angemessener Preis machen diese für uns zur „köstlichsten“ Wahl. Darüber hinaus können Sie von der AMD-Website das Radeon RAMDisk-Programm herunterladen, mit dem wir absolut kostenlos ein superschnelles virtuelles Laufwerk mit bis zu 6 GB erstellen können – und jeder liebt kostenlose nützliche Dinge.


Eigenschaften
Erinnerung 8 GB
Anzahl Module 2
Speicherstandard PC3-10600 (DDR3 1333 MHz)
Arbeitsfrequenz bis zu 1333 MHz
Zeitangaben 9-9-9-24
Versorgungsspannung 1,5 V
Bandbreite 10667 Mbit/s

Sie können das integrierte Video nur in „Minesweeper“ bequem abspielen. Um Ihren Computer auf Gaming-Niveau aufzurüsten, haben wir uns daher für ein modernes und leistungsstarkes, aber nicht das teuerste Modell entschieden.


Es verfügte über 2 GB Videospeicher und unterstützte DirectX 11 und OpenGL 4.x. und ein ausgezeichnetes Twin Frozr IV Kühlsystem. Seine Leistung sollte mehr als ausreichen, damit wir die neuesten Teile der beliebtesten Gaming-Franchises wie Tomb Raider, Crysis, Hitman und genießen können Weit entfernt. Die Eigenschaften der von uns ausgewählten sind wie folgt:


Eigenschaften
GPU GeForce GTX 770
GPU-Frequenz 1098 MHz oder bis zu 1150 MHz im GPU-Boost-Modus
Anzahl der Shader-Prozessoren 1536
Videospeicher 2 GB
Videospeichertyp GDDR5
Breite des Videospeicherbusses 256 Bit
Videospeicherfrequenz 1753 MHz (7,010 GHz QDR)
Anzahl der Pixelpipelines 128, 32 Textur-Sampling-Einheiten
Schnittstelle PCI-Express 3.0 16x (kompatibel mit PCI Express 2.x/1.x) mit der Möglichkeit, Karten per SLI zu kombinieren.
Häfen DisplayPort-, DVI-D-, DVI-I-, HDMI- und D-Sub-Adapter im Lieferumfang enthalten
Kühlung der Grafikkarte Aktiv (Kühlkörper + 2 Twin Frozr IV-Lüfter auf der Vorderseite des Boards)
Stecker 8-polig + 8-polig
API-Unterstützung DirectX 11 und OpenGL 4.x
Grafikkartenlänge (gemessen in NICS) 263 mm
Computerunterstützung allgemeiner Zweck auf GPU DirectCompute 11, NVIDIA PhysX, CUDA, CUDA C++, OpenCL 1.0
Maximaler Stromverbrauch FurMark+WinRar 255 W
Leistungsbewertung 61.5

Unerwartete Schwierigkeiten

Jetzt haben wir alles, was wir brauchen, um unseren Computer aufzurüsten. Wir werden neue Komponenten in unser bestehendes Gehäuse einbauen.


Wir starten es und es funktioniert nicht. Und warum? Aber weil preisgünstige Netzteile physikalisch nicht in der Lage sind, einen Computer mit irgendeiner Leistung zu betreiben. Tatsache ist, dass in unserem Fall das Netzteil zwei 8-Pin-Anschlüsse benötigt und das Netzteil nur einen 6-Pin-Grafikkarten-Stromanschluss an seiner Basis hat. Wenn man bedenkt, dass viele Menschen noch mehr Anschlüsse benötigen als in unserem Fall, wird klar, dass die Stromversorgung geändert werden muss.

Aber das ist nicht so schlimm. Denken Sie nur, es gibt keinen Stromanschluss! In unserem Testlabor haben wir recht seltene Adapter von 6-Pin auf 8-Pin und von Molex auf 6-Pin gefunden. Wie diese:


Es ist erwähnenswert, dass es selbst bei preisgünstigen modernen Netzteilen mit jeder neuen Version von Molex-Anschlüssen immer weniger Molex-Anschlüsse gibt – wir können also sagen, dass wir Glück haben.

Auf den ersten Blick ist alles in Ordnung und mit einigen Tricks konnten wir ein Update durchführen Systemeinheit zur „Gamer“-Konfiguration. Lassen Sie uns nun die Belastung simulieren, indem wir den Furmark-Test und den 7Zip-Archiver gleichzeitig im Xtreme Burning-Modus auf unserem neuen Gaming-Computer ausführen. Wir konnten den Computer starten – schon gut. Das System überlebte auch die Einführung von Furmark. Wir starten den Archiver – und was ist das?! Der Computer schaltete sich ab und erfreute uns mit dem Dröhnen eines auf Maximum gedrehten Lüfters. Der „bescheidene“ Standard von 400 W war trotz aller Bemühungen nicht in der Lage, die Grafikkarte und den leistungsstarken Prozessor zu versorgen. Und aufgrund des mittelmäßigen Kühlsystems wurde unseres sehr heiß, und selbst die maximale Lüftergeschwindigkeit erlaubte es nicht, mindestens die angegebenen 400 W zu produzieren.

Es gibt einen Ausgang!

Wir sind angekommen. Wir haben teure Komponenten gekauft, um einen Gaming-Computer zusammenzubauen, aber es stellte sich heraus, dass wir nicht darauf spielen können. Es ist eine Schande. Das Fazit ist für jeden klar: Das alte ist für uns nicht geeignet Gaming-Computer, und es muss dringend durch ein neues ersetzt werden. Aber welches genau?

Für unseren aufgerüsteten Computer haben wir nach vier Hauptkriterien ausgewählt:

Das erste ist natürlich die Macht. Wir entschieden uns lieber für die Reserve – wir wollten den Prozessor übertakten und in synthetischen Tests punkten. Unter Berücksichtigung aller künftigen Anforderungen haben wir uns für eine Leistung von mindestens 800 W entschieden.

Das zweite Kriterium ist die Zuverlässigkeit. Wir möchten wirklich, dass das „mit Reserve“ genommene Gerät die nächste Generation von Grafikkarten und Prozessoren übersteht, nicht von selbst durchbrennt und gleichzeitig keine teuren Komponenten (zusammen mit der Testplattform) verbrennt. Daher haben wir uns ausschließlich für japanische Kondensatoren, nur Kurzschlussschutz und einen zuverlässigen Überlastschutz aller Ausgänge entschieden.

Der dritte Punkt unserer Anforderungen ist Komfort und Funktionalität.. Zunächst einmal brauchen wir – der Computer wird oft arbeiten, und besonders laute Netzteile, gepaart mit einer Grafikkarte und einem Prozessorkühler, werden jeden Benutzer in den Wahnsinn treiben. Zudem ist uns der Sinn für Schönheit nicht fremd, daher sollte das neue Netzteil für unseren Gaming-Rechner modular aufgebaut sein und über abnehmbare Kabel und Anschlüsse verfügen. Damit nichts überflüssig ist.

Und als letztes auf der Liste, aber nicht zuletzt, steht das Kriterium Energieeffizienz. Ja, wir kümmern uns sowohl um die Umwelt als auch um die Stromrechnung. Daher muss das von uns gewählte Netzteil mindestens dem Energieeffizienzstandard 80+ Bronze entsprechen.

Nachdem wir alle Anforderungen verglichen und analysiert hatten, wählten wir unter den wenigen Bewerbern denjenigen aus, der alle unsere Anforderungen am besten erfüllte. Es wurde eine Leistung von 850W erreicht. Beachten Sie, dass es in einigen Parametern sogar unsere Anforderungen übertroffen hat. Sehen wir uns die Spezifikation an:

Eigenschaften der Stromversorgung
Art der Ausrüstung Netzteil mit aktivem PFC-Modul (Power Factor Correction).
Eigenschaften Schleifengeflecht, japanische Kondensatoren, Kurzschlussschutz (SCP), Überspannungsschutz (OVP), Überlastschutz für jeden einzelnen Geräteausgang (OCP)
+3,3V – 24A, +5V – 24A, +12V – 70A, +5VSB – 3,0A, -12V – 0,5 A
Abnehmbare Stromkabel Ja
Effizienz 90 %, 80 PLUS Gold zertifiziert
Stromversorgung 850 W
Motherboard-Stromanschluss 24+8+8 Pin, 24+8+4 Pin, 24+8 Pin, 24+4 Pin, 20+4 Pin (abnehmbarer 24-Pin-Stecker. 4-Pin kann bei Bedarf abgezogen werden, abnehmbarer 8-Pin-Stecker)
Stromanschluss der Grafikkarte 6x 6/8-Pin-Stecker (zerlegbarer 8-Pin-Stecker – 2 Pins abnehmbar)
MTBF 100.000 Stunden
Kühlung des Netzteils 1 Lüfter: 140 x 140 mm (an der unteren Wand). Passives Kühlsystem bei Last bis zu 50 %.
Steuerung der Lüftergeschwindigkeit Vom Temperatursensor. Ändern der Lüftergeschwindigkeit abhängig von der Temperatur im Netzteil. Manuelle Auswahl der Lüfterbetriebsart. Im Normalmodus dreht sich der Lüfter konstant, im Silent-Modus stoppt er bei geringer Last komplett.


, eines der besten für das Geld. Installieren wir es in unserem Fall:


Dann passierte etwas, das uns ein wenig verwirrte. Es scheint, dass alles richtig zusammengebaut wurde, alles angeschlossen war, alles funktionierte – aber das Netzteil ist stumm! Das heißt im Allgemeinen: Der Lüfter hat stillgestanden und steht immer noch, die Anlage ist ordnungsgemäß angelaufen und funktioniert. Fakt ist, dass das Netzteil bei einer Auslastung von bis zu 50 % im sogenannten Quiet-Modus arbeitet – ohne den Lüfter des Kühlsystems hochzudrehen. Der Lüfter brummt nur unter hoher Last – der gleichzeitige Start von Archivern und Furmark ließ den Kühler trotzdem rotieren.


Das Netzteil verfügt über bis zu sechs 8-polige 6-polige Grafikkarten-Stromanschlüsse, von denen jeder ein zusammenklappbarer 8-poliger Stecker ist, von dem bei Bedarf 2 Stifte gelöst werden können. Somit ist es in der Lage, jede Grafikkarte problemlos zu versorgen. Und nicht einmal einer.


Das modulare Stromversorgungssystem ermöglicht das Lösen überschüssiger und unnötiger Stromkabel, was die Luftzirkulation des Gehäuses, die Systemstabilität und natürlich die Ästhetik verbessert Aussehen Innenraum, weshalb wir es Moddern und Fans von Gehäusen mit Fenstern ohne Bedenken empfehlen können.
Kaufen Sie ein zuverlässiges und leistungsstarkes Netzteil. In unserer Rezension wurde es. - und wie Sie sehen, ist das kein Zufall. Mit dem Kauf bei NICS können Sie sicher sein, dass alle Komponenten Ihres Hochleistungssystems ausreichend und ausreichend versorgt sind unterbrechungsfreie Stromversorgung, selbst bei extremer Übertaktung.


Darüber hinaus verfügt das Netzteil noch über mehrere Jahre über ausreichend Leistung – besser mit einer Reserve für den Fall, dass Sie das System in Zukunft mit hochwertigen Komponenten aufrüsten.

Grundkomponenten einer Grafikkarte:

  • Ausgänge;
  • Schnittstellen;
  • Kühlsystem;
  • GPU;
  • Videospeicher.

Grafiktechnologien:

  • Wörterbuch;
  • GPU-Architektur: Funktionen
    Vertex-/Pixeleinheiten, Shader, Füllrate, Textur-/Rastereinheiten, Pipelines;
  • GPU-Architektur: Technologie
    technischer Prozess, GPU-Frequenz, lokaler Videospeicher (Volumen, Bus, Typ, Frequenz), Lösungen mit mehreren Grafikkarten;
  • visuelle Funktionen
    DirectX, High Dynamic Range (HDR), Vollbild-Anti-Aliasing, Texturfilterung, hochauflösende Texturen.

Glossar grundlegender grafischer Begriffe

Aktualisierungsrate

Genau wie in einem Kino oder Fernseher simuliert Ihr Computer Bewegungen auf dem Monitor, indem er eine Folge von Bildern anzeigt. Die Bildwiederholfrequenz des Monitors gibt an, wie oft pro Sekunde das Bild auf dem Bildschirm aktualisiert wird. Beispielsweise entspricht eine Frequenz von 75 Hz 75 Aktualisierungen pro Sekunde.

Wenn der Computer Frames schneller verarbeitet, als der Monitor ausgeben kann, kann es bei Spielen zu Problemen kommen. Wenn der Computer beispielsweise 100 Bilder pro Sekunde rendert und die Bildwiederholfrequenz des Monitors 75 Hz beträgt, kann der Monitor aufgrund von Überlappungen während der Bildwiederholperiode nur einen Teil des Bildes anzeigen. Als Folge davon treten visuelle Artefakte auf.

Als Lösung können Sie V-Sync (vertikale Synchronisierung) aktivieren. Es begrenzt die Anzahl der Bilder, die der Computer ausgeben kann, auf die Bildwiederholfrequenz des Monitors und verhindert so Artefakte. Wenn Sie V-Sync aktivieren, wird die im Spiel berechnete Anzahl von Bildern niemals die Bildwiederholfrequenz überschreiten. Das heißt, bei 75 Hz gibt der Computer nicht mehr als 75 Bilder pro Sekunde aus.

Pixel

Das Wort „Pixel“ steht für „ Bild tur el ement“ – Bildelement. Dabei handelt es sich um einen winzigen Punkt auf dem Display, der in einer bestimmten Farbe leuchten kann (in den meisten Fällen wird der Farbton durch eine Kombination aus drei Grundfarben angezeigt: Rot, Grün und Blau). Wenn die Bildschirmauflösung 1024 x 768 beträgt, sehen Sie eine Matrix mit 1024 Pixeln Breite und 768 Pixeln Höhe. Alle Pixel zusammen ergeben das Bild. Das Bild auf dem Bildschirm wird je nach Anzeigetyp und Datenausgabe der Grafikkarte 60 bis 120 Mal pro Sekunde aktualisiert. CRT-Monitore aktualisieren die Anzeige Zeile für Zeile, während LCD-Flachbildschirme jedes Pixel einzeln aktualisieren können.

Scheitel

Alle Objekte in einer 3D-Szene bestehen aus Scheitelpunkten. Ein Scheitelpunkt ist ein Punkt im dreidimensionalen Raum mit den Koordinaten X, Y und Z. Mehrere Scheitelpunkte können zu einem Polygon gruppiert werden: Meistens handelt es sich um ein Dreieck, es sind jedoch auch komplexere Formen möglich. Anschließend wird auf das Polygon eine Textur angewendet, die dem Objekt ein realistisches Aussehen verleiht. Der in der Abbildung oben gezeigte 3D-Würfel besteht aus acht Eckpunkten. Komplexere Objekte haben gekrümmte Oberflächen, die tatsächlich aus einer sehr großen Anzahl von Eckpunkten bestehen.

Textur

Eine Textur ist einfach ein 2D-Bild beliebiger Größe, das auf ein 3D-Objekt abgebildet wird, um dessen Oberfläche zu simulieren. Unser 3D-Würfel besteht beispielsweise aus acht Eckpunkten. Vor dem Auftragen der Textur sieht es so aus einfache Kiste. Aber wenn wir die Textur anwenden, wird die Box farbig.

Shader

Pixel-Shader-Programme ermöglichen der Grafikkarte beeindruckende Effekte, wie zum Beispiel dieses Wasserein Elder Scrolls: Vergessenheit.

Heutzutage gibt es zwei Arten von Shader: Vertex und Pixel. Vertex-Shader-Programme können 3D-Objekte modifizieren oder transformieren. Mit Pixel-Shader-Programmen können Sie die Farben von Pixeln basierend auf bestimmten Daten ändern. Stellen Sie sich eine Lichtquelle in einer 3D-Szene vor, die beleuchtete Objekte heller leuchten lässt und gleichzeitig dafür sorgt, dass Schatten auf andere Objekte geworfen werden. All dies wird durch die Änderung der Farbinformationen der Pixel erreicht.

Pixel-Shader werden verwendet, um komplexe Effekte in Ihren Lieblingsspielen zu erzeugen. Beispielsweise kann Shader-Code dafür sorgen, dass die Pixel rund um ein 3D-Schwert heller leuchten. Ein weiterer Shader kann alle Eckpunkte eines komplexen 3D-Objekts verarbeiten und eine Explosion simulieren. Spieleentwickler greifen zunehmend auf ausgefeilte Shader-Programme zurück, um realistische Grafiken zu erstellen. Fast jedes moderne Spiel mit reichhaltiger Grafik verwendet Shader.

Mit der Veröffentlichung der nächsten An(API), Microsoft DirectX 10, wird ein dritter Shadertyp veröffentlicht, der als Geometrie-Shader bezeichnet wird. Mit ihrer Hilfe wird es je nach gewünschtem Ergebnis möglich sein, Objekte zu zerbrechen, zu verändern und sogar zu zerstören. Der dritte Shadertyp kann genauso programmiert werden wie die ersten beiden, hat jedoch eine andere Rolle.

Füllrate

Sehr oft findet man auf der Verpackung einer Grafikkarte den Wert der Füllrate. Grundsätzlich gibt die Füllrate an, wie schnell die GPU Pixel ausgeben kann. Ältere Grafikkarten hatten eine Dreiecksfüllrate. Heutzutage gibt es jedoch zwei Arten von Füllraten: Pixelfüllrate und Texturfüllrate. Wie bereits erwähnt, entspricht die Pixelfüllrate der Pixelausgaberate. Sie wird als Anzahl der Rasteroperationen (ROP) multipliziert mit der Taktfrequenz berechnet.

Die Texturfüllrate wird von ATi und nVidia unterschiedlich berechnet. Nvidia geht davon aus, dass Geschwindigkeit durch Multiplikation der Anzahl der Pixel-Pipelines mit der Taktfrequenz erreicht wird. Und ATi multipliziert die Anzahl der Textureinheiten mit der Taktrate. Im Prinzip sind beide Methoden korrekt, da nVidia eine Textureinheit pro Pixel-Shader-Einheit (also eine pro Pixel-Pipeline) verwendet.

Lassen Sie uns mit diesen Definitionen im Hinterkopf fortfahren und die wichtigsten Funktionen der GPU diskutieren, was sie tun und warum sie so wichtig sind.

GPU-Architektur: Funktionen

Der Realismus von 3D-Grafiken hängt stark von der Leistung der Grafikkarte ab. Je mehr Pixel-Shader-Blöcke der Prozessor enthält und je höher die Frequenz, desto mehr Effekte können auf die 3D-Szene angewendet werden, um deren visuelle Wahrnehmung zu verbessern.

Die GPU enthält viele verschiedene Funktionsblöcke. Anhand der Anzahl einiger Komponenten können Sie abschätzen, wie leistungsfähig die GPU ist. Bevor wir fortfahren, werfen wir einen Blick auf die wichtigsten Funktionsblöcke.

Vertex-Prozessoren (Vertex-Shader-Einheiten)

Wie Pixel-Shader-Einheiten führen Vertex-Prozessoren Shader-Code aus, der Scheitelpunkte berührt. Da ein größeres Vertex-Budget die Erstellung komplexerer 3D-Objekte ermöglicht, ist die Leistung von Vertex-Prozessoren in 3D-Szenen mit komplexen oder vielen Objekten sehr wichtig. Allerdings haben Vertex-Shader-Einheiten immer noch keinen so offensichtlichen Einfluss auf die Leistung wie Pixelprozessoren.

Pixelprozessoren (Pixel-Shader-Einheiten)

Ein Pixelprozessor ist eine Komponente eines Grafikchips, die für die Verarbeitung von Pixel-Shader-Programmen bestimmt ist. Diese Prozessoren führen Berechnungen durch, die nur Pixel betreffen. Da Pixel Farbinformationen enthalten, können Sie mit Pixel-Shadern beeindruckende grafische Effekte erzielen. Beispielsweise werden die meisten Wassereffekte, die Sie in Spielen sehen, mithilfe von Pixel-Shadern erstellt. Typischerweise wird die Anzahl der Pixelprozessoren verwendet, um die Pixelleistung von Grafikkarten zu vergleichen. Wenn eine Karte über acht Pixel-Shader-Einheiten und eine andere über 16 Einheiten verfügt, ist es logisch anzunehmen, dass eine Grafikkarte mit 16 Einheiten bei der Verarbeitung komplexer Pixel-Shader-Programme schneller ist. Auch die Taktrate sollte berücksichtigt werden, allerdings ist heute eine Verdoppelung der Anzahl der Pixelprozessoren energieeffizienter als eine Verdoppelung der Frequenz des Grafikchips.

Einheitliche Shader

Unified Shader sind in der PC-Welt noch nicht angekommen, aber der kommende DirectX 10-Standard basiert auf einer ähnlichen Architektur. Das heißt, die Codestruktur von Vertex-, Geometrie- und Pixelprogrammen ist dieselbe, obwohl Shader unterschiedliche Aufgaben ausführen. Zu sehen ist die neue Spezifikation bei der Xbox 360, deren GPU speziell von ATi für Microsoft entwickelt wurde. Es wird sehr interessant sein zu sehen, welches Potenzial das neue DirectX 10 mit sich bringt.

Texture Mapping Units (TMU)

Texturen sollten ausgewählt und gefiltert werden. Diese Arbeit wird von Texture-Mapping-Einheiten übernommen, die in Verbindung mit Pixel- und Vertex-Shader-Einheiten arbeiten. Die Aufgabe der TMU besteht darin, Texturoperationen auf Pixel anzuwenden. Die Anzahl der Textureinheiten in einer GPU wird oft verwendet, um die Texturleistung von Grafikkarten zu vergleichen. Man kann davon ausgehen, dass eine Grafikkarte mit mehr TMUs eine bessere Texturleistung liefert.

Raster-Operator-Einheiten (ROP)

Rasterprozessoren sind für das Schreiben von Pixeldaten in den Speicher verantwortlich. Die Geschwindigkeit, mit der dieser Vorgang ausgeführt wird, ist die Füllrate. In den Anfängen von 3D-Beschleunigern waren ROP und Füllrate sehr hoch wichtige Eigenschaften Grafikkarten Heutzutage ist die ROP-Arbeit immer noch wichtig, aber die Leistung der Grafikkarte wird nicht mehr wie früher durch diese Blöcke eingeschränkt. Daher wird die Leistung (und Anzahl) von ROPs selten zur Bewertung der Geschwindigkeit einer Grafikkarte herangezogen.

Förderer

Pipelines werden verwendet, um die Architektur von Grafikkarten zu beschreiben und eine sehr klare Vorstellung von der Leistung der GPU zu vermitteln.

„Förderer“ kann nicht als strenger Fachbegriff betrachtet werden. Die GPU verwendet verschiedene Pipelines, die unterschiedliche Funktionen ausführen. Historisch gesehen bedeutete eine Pipeline einen Pixelprozessor, der mit seiner Texture Mapping Unit (TMU) verbunden war. Beispielsweise verwendet die Radeon 9700-Grafikkarte acht Pixelprozessoren, von denen jeder mit seiner eigenen TMU verbunden ist, sodass davon ausgegangen wird, dass die Karte über acht Pipelines verfügt.

Moderne Prozessoren lassen sich jedoch nur sehr schwer durch die Anzahl der Pipelines beschreiben. Im Vergleich zu früheren Designs verwenden die neuen Prozessoren einen modularen, fragmentierten Aufbau. Als Innovator auf diesem Gebiet gilt ATi, das mit der X1000-Grafikkartenreihe auf einen modularen Aufbau umgestiegen ist, der es ermöglicht, durch interne Optimierung Leistungssteigerungen zu erzielen. Einige CPU-Blöcke werden häufiger genutzt als andere, und um die GPU-Leistung zu verbessern, hat ATi versucht, einen Kompromiss zwischen der Anzahl der benötigten Blöcke und der Chipfläche (die nicht sehr viel vergrößert werden kann) zu finden. In dieser Architektur hat der Begriff „Pixelpipeline“ bereits seine Bedeutung verloren, da die Pixelprozessoren nicht mehr an eigene TMUs angeschlossen sind. Beispielsweise verfügt die ATi Radeon X1600 GPU über 12 Pixel-Shader-Einheiten und nur vier TMU-Textur-Mapping-Einheiten. Daher kann man nicht sagen, dass die Architektur dieses Prozessors über 12-Pixel-Pipelines verfügt, und man kann auch nicht sagen, dass es nur vier davon gibt. Traditionell wird jedoch immer noch von Pixel-Pipelines gesprochen.

Unter Berücksichtigung der oben genannten Annahmen wird die Anzahl der Pixel-Pipelines in einer GPU häufig zum Vergleich von Grafikkarten herangezogen (mit Ausnahme der ATi X1x00-Reihe). Wenn Sie beispielsweise Grafikkarten mit 24 und 16 Pipelines nehmen, kann man durchaus davon ausgehen, dass die Karte mit 24 Pipelines schneller ist.

GPU-Architektur: Technologie

Technischer Prozess

Dieser Begriff bezieht sich auf die Größe eines Elements (Transistors) des Chips und die Genauigkeit des Herstellungsprozesses. Verbesserungen der technischen Prozesse ermöglichen es, Elemente kleinerer Größe zu erhalten. Beispielsweise erzeugt der 0,18-Mikrometer-Prozess größere Strukturen als der 0,13-Mikrometer-Prozess und ist daher nicht so effizient. Kleinere Transistoren arbeiten mit niedrigerer Spannung. Eine Verringerung der Spannung führt wiederum zu einer Verringerung des Wärmewiderstands, was zu einer Verringerung der erzeugten Wärmemenge führt. Verbesserungen im technischen Prozess ermöglichen es, den Abstand zwischen den Funktionsblöcken des Chips zu verringern und die Datenübertragung dauert weniger Zeit. Durch kürzere Distanzen, niedrigere Spannungen und andere Verbesserungen können höhere Taktraten erreicht werden.

Was das Verständnis etwas erschwert, ist, dass heute sowohl Mikrometer (μm) als auch Nanometer (nm) zur Bezeichnung eines technischen Prozesses verwendet werden. Tatsächlich ist alles ganz einfach: 1 Nanometer entspricht 0,001 Mikrometer, also sind 0,09-μm- und 90-nm-Prozesse dasselbe. Wie oben erwähnt, ermöglicht eine kleinere Prozesstechnologie höhere Taktraten. Wenn wir beispielsweise Grafikkarten mit 0,18-Mikrometer- und 0,09-Mikrometer-Chips (90 nm) vergleichen, ist es durchaus vernünftig, von einer 90-nm-Karte eine höhere Frequenz zu erwarten.

GPU-Taktgeschwindigkeit

Die GPU-Taktgeschwindigkeit wird in Megahertz (MHz) gemessen, was Millionen Taktzyklen pro Sekunde entspricht.

Die Taktrate wirkt sich direkt auf die GPU-Leistung aus. Je höher es ist, desto mehr Arbeit kann in einer Sekunde erledigt werden. Nehmen wir als erstes Beispiel die Grafikkarten nVidia GeForce 6600 und 6600 GT: Die 6600 GT-GPU läuft mit 500 MHz, während die reguläre 6600-Karte mit 400 MHz läuft. Da die Prozessoren technisch identisch sind, führt die um 20 % erhöhte Taktrate des 6600 GT zu einer höheren Leistung.

Aber die Taktrate ist nicht alles. Bedenken Sie, dass die Leistung stark von der Architektur beeinflusst wird. Nehmen wir als zweites Beispiel die Grafikkarten GeForce 6600 GT und GeForce 6800 GT. Die 6600 GT-GPU taktet mit 500 MHz, die 6800 GT läuft jedoch nur mit 350 MHz. Berücksichtigen wir nun, dass der 6800 GT 16-Pixel-Pipelines verwendet, während der 6600 GT nur acht verwendet. Daher bietet ein 6800 GT mit 16 Pipelines bei 350 MHz ungefähr die gleiche Leistung wie ein Prozessor mit acht Pipelines und der doppelten Taktrate (700 MHz). Vor diesem Hintergrund lässt sich die Taktrate problemlos zum Vergleich der Leistung heranziehen.

Lokaler Videospeicher

Der Grafikkartenspeicher hat großen Einfluss auf die Leistung. Unterschiedliche Speicherparameter haben jedoch unterschiedliche Auswirkungen.

Größe des Videospeichers

Die Größe des Videospeichers kann wahrscheinlich als der am meisten überschätzte Parameter einer Grafikkarte bezeichnet werden. Unerfahrene Verbraucher verwenden häufig die Videospeicherkapazität, um verschiedene Karten miteinander zu vergleichen. In Wirklichkeit hat die Kapazität jedoch im Vergleich zu Parametern wie Speicherbusfrequenz und Schnittstelle (Busbreite) kaum Auswirkungen auf die Leistung.

In den meisten Fällen bietet eine Karte mit 128 MB Videospeicher fast die gleiche Leistung wie eine Karte mit 256 MB. Natürlich gibt es Situationen, in denen mehr Speicher die Leistung verbessert, aber bedenken Sie, dass mehr Speicher nicht automatisch zu schnelleren Spielgeschwindigkeiten führt.

Wo Lautstärke nützlich sein kann, sind Spiele mit hochauflösenden Texturen. Spieleentwickler stellen mehrere Textursätze für das Spiel bereit. Und je mehr Speicher auf der Grafikkarte vorhanden ist, desto höher ist die Auflösung der geladenen Texturen. Hochauflösende Texturen sorgen für mehr Klarheit und Detailgenauigkeit im Spiel. Daher ist es durchaus sinnvoll, eine Karte mit viel Speicher zu nehmen, wenn alle anderen Kriterien zutreffen. Wir möchten Sie noch einmal daran erinnern, dass die Breite des Speicherbusses und seine Frequenz einen viel stärkeren Einfluss auf die Leistung haben als die Größe des physischen Speichers auf der Karte.

Breite des Speicherbusses

Die Breite des Speicherbusses ist einer der wichtigsten Aspekte der Speicherleistung. Moderne Busse sind zwischen 64 und 256 Bit breit, in manchen Fällen sogar 512 Bit. Je breiter der Speicherbus ist, desto mehr Informationen kann er pro Taktzyklus übertragen. Und das wirkt sich direkt auf die Produktivität aus. Wenn Sie beispielsweise zwei Busse mit gleichen Frequenzen verwenden, überträgt ein 128-Bit-Bus theoretisch doppelt so viele Daten pro Taktzyklus wie ein 64-Bit-Bus. Und der 256-Bit-Bus ist doppelt so groß.

Eine höhere Busbandbreite (ausgedrückt in Bits oder Bytes pro Sekunde, 1 Byte = 8 Bits) führt zu einer höheren Speicherleistung. Aus diesem Grund ist der Speicherbus viel wichtiger als seine Größe. Bei gleichen Frequenzen arbeitet der 64-Bit-Speicherbus mit einer Geschwindigkeit von nur 25 % der 256-Bit-Busgeschwindigkeit!

Nehmen wir das folgende Beispiel. Eine Grafikkarte mit 128 MB Videospeicher, aber mit einem 256-Bit-Bus, bietet eine viel höhere Speicherleistung als ein 512-MB-Modell mit einem 64-Bit-Bus. Es ist wichtig zu beachten, dass die Hersteller bei einigen Karten der ATi X1x00-Reihe die Spezifikationen des internen Speicherbusses angeben, uns aber die Parameter des externen Busses interessieren. Beispielsweise verfügt der X1600 über einen internen Ringbus mit einer Breite von 256 Bit, einen externen jedoch nur mit einer Breite von 128 Bit. Und tatsächlich arbeitet der Speicherbus mit einer 128-Bit-Leistung.

Speichertypen

Speicher lassen sich in zwei Hauptkategorien einteilen: SDR (Single Data Transfer) und DDR (Double Data Transfer), bei denen Daten pro Taktzyklus doppelt so schnell übertragen werden. Heutzutage ist die SDR-Technologie mit Einzelübertragung veraltet. Da DDR-Speicher Daten doppelt so schnell wie SDR überträgt, ist es wichtig zu bedenken, dass Grafikkarten mit DDR-Speicher meistens die doppelte Frequenz und nicht die physische Frequenz anzeigen. Wenn der DDR-Speicher beispielsweise mit 1000 MHz spezifiziert ist, ist dies die effektive Frequenz, mit der regulärer SDR-Speicher betrieben werden muss, um den gleichen Durchsatz zu erzielen. Tatsächlich beträgt die physikalische Frequenz jedoch 500 MHz.

Aus diesem Grund sind viele überrascht, wenn für den Speicher ihrer Grafikkarte die Frequenz von 1200 MHz DDR angegeben wird und Versorgungsunternehmen 600 MHz melden. Man muss sich also daran gewöhnen. DDR2- und GDDR3/GDDR4-Speicher funktionieren nach dem gleichen Prinzip, also mit doppelter Datenübertragung. Der Unterschied zwischen DDR-, DDR2-, GDDR3- und GDDR4-Speicher liegt in der Produktionstechnologie und einigen Details. DDR2 kann mit höheren Frequenzen betrieben werden als DDR-Speicher und DDR3 – sogar höher als DDR2.

Speicherbusfrequenz

Wie ein Prozessor arbeitet auch der Speicher (oder genauer gesagt der Speicherbus) mit bestimmten Taktraten, gemessen in Megahertz. Hier wirken sich steigende Taktraten direkt auf die Speicherleistung aus. Und die Speicherbusfrequenz ist einer der Parameter, anhand derer die Leistung von Grafikkarten verglichen wird. Wenn beispielsweise alle anderen Eigenschaften (Speicherbusbreite usw.) gleich sind, kann man logischerweise sagen, dass eine Grafikkarte mit 700-MHz-Speicher schneller ist als eine mit 500-MHz-Speicher.

Auch hier ist die Taktrate nicht alles. 700-MHz-Speicher mit einem 64-Bit-Bus ist langsamer als 400-MHz-Speicher mit einem 128-Bit-Bus. Die Leistung von 400-MHz-Speicher auf einem 128-Bit-Bus entspricht in etwa der Leistung von 800-MHz-Speicher auf einem 64-Bit-Bus. Sie sollten auch bedenken, dass GPU- und Speicherfrequenzen völlig unterschiedliche Parameter sind und sich normalerweise unterscheiden.

Grafikkartenschnittstelle

Alle zwischen der Grafikkarte und dem Prozessor übertragenen Daten werden über die Grafikkartenschnittstelle übertragen. Heutzutage werden für Grafikkarten drei Arten von Schnittstellen verwendet: PCI, AGP und PCI Express. Sie unterscheiden sich in der Bandbreite und anderen Eigenschaften. Es ist klar, dass die Austauschgeschwindigkeit umso höher ist, je höher der Durchsatz ist. Allerdings können nur die modernsten Karten eine hohe Bandbreite nutzen, und selbst dann nur teilweise. Irgendwann war die Schnittstellengeschwindigkeit kein Flaschenhals mehr, heute reicht sie einfach aus.

Der langsamste Bus, für den Grafikkarten hergestellt wurden, ist PCI (Peripheral Components Interconnect). Natürlich ohne auf die Geschichte einzugehen. PCI hat die Leistung von Grafikkarten erheblich beeinträchtigt, sodass sie auf die AGP-Schnittstelle (Accelerated Graphics Port) umgestiegen sind. Aber selbst die AGP 1.0- und 2x-Spezifikationen schränkten die Leistung ein. Als der Standard die Geschwindigkeit auf das 4-fache AGP-Niveau erhöhte, näherten wir uns der praktischen Grenze der Bandbreite, die Grafikkarten verarbeiten können. Durch die AGP-8x-Spezifikation konnte der Durchsatz im Vergleich zu AGP 4x (2,16 GB/s) noch einmal verdoppelt werden, eine spürbare Steigerung der Grafikleistung konnten wir jedoch nicht mehr verzeichnen.

Der neueste und schnellste Bus ist PCI Express. Neue Grafikkarten nutzen typischerweise die PCI-Express-x16-Schnittstelle, die 16 PCI-Express-Lanes für einen Gesamtdurchsatz von 4 GB/s (eine Richtung) kombiniert. Dies ist der doppelte Durchsatz von AGP 8x. Der PCI-Express-Bus stellt die genannte Bandbreite in beide Richtungen (Datenübertragung zur und von der Grafikkarte) zur Verfügung. Die Geschwindigkeit des AGP 8x-Standards war jedoch bereits ausreichend, sodass wir noch keine Situation erlebt haben, in der der Wechsel zu PCI Express zu einer Leistungssteigerung im Vergleich zu AGP 8x führte (bei gleichen anderen Hardwareparametern). Beispielsweise funktioniert die AGP-Version der GeForce 6800 Ultra identisch mit der 6800 Ultra für PCI Express.

Heute ist es am besten, eine Karte mit PCI-Express-Schnittstelle zu kaufen, sie wird noch einige Jahre auf dem Markt bleiben. Die leistungsstärksten Karten werden nicht mehr mit der AGP 8x-Schnittstelle hergestellt und PCI-Express-Lösungen sind in der Regel leichter zu finden als AGP-Pendants und günstiger.

Lösungen auf mehreren Grafikkarten

Die Verwendung mehrerer Grafikkarten zur Steigerung der Grafikleistung ist keine neue Idee. In den Anfängen der 3D-Grafik kam 3dfx mit zwei parallel laufenden Grafikkarten auf den Markt. Doch mit dem Verschwinden von 3dfx geriet die Technologie zum gemeinsamen Betrieb mehrerer Consumer-Grafikkarten in Vergessenheit, obwohl ATi seit der Veröffentlichung der Radeon 9700 ähnliche Systeme für professionelle Simulatoren herstellte. Vor einigen Jahren kehrte die Technologie zurück den Markt: mit dem Aufkommen von nVidia SLI-Lösungen und etwas später ATi Crossfire.

Die gemeinsame Verwendung mehrerer Grafikkarten bietet ausreichend Leistung, um das Spiel mit hohen Qualitätseinstellungen und hoher Auflösung auszuführen. Doch die Wahl der einen oder anderen Lösung ist nicht so einfach.

Beginnen wir mit der Tatsache, dass Lösungen, die auf mehreren Grafikkarten basieren, erforderlich sind große Menge Energie, daher muss die Stromversorgung leistungsstark genug sein. Die gesamte Wärme muss von der Grafikkarte abgeführt werden. Daher müssen Sie auf das PC-Gehäuse und die Kühlung achten, damit das System nicht überhitzt.

Denken Sie auch daran, dass SLI/CrossFire ein entsprechendes Motherboard erfordert (entweder für die eine oder andere Technologie), das normalerweise mehr kostet als Standardmodelle. Die nVidia SLI-Konfiguration funktioniert nur auf bestimmten nForce4-Karten und ATi CrossFire-Karten funktionieren nur auf bestimmten Motherboards mit CrossFire-Chipsatz oder auf einigen Intel-Modellen. Erschwerend kommt hinzu, dass einige CrossFire-Konfigurationen eine spezielle Karte erfordern: CrossFire Edition. Nach der Veröffentlichung von CrossFire für einige Grafikkartenmodelle erlaubte ATi die Integration von Technologie für die Zusammenarbeit PCI-Bus Express und mit der Veröffentlichung neuer Treiberversionen erhöht sich die Anzahl der möglichen Kombinationen. Dennoch bietet Hardware-CrossFire mit der entsprechenden CrossFire Edition-Karte eine höhere Leistung. Allerdings sind CrossFire-Edition-Karten auch teurer als reguläre Modelle. Derzeit können Sie den Software-CrossFire-Modus (ohne CrossFire Edition-Karte) auf den Grafikkarten Radeon X1300, X1600 und X1800 GTO aktivieren.

Es sind auch andere Faktoren zu berücksichtigen. Obwohl zwei Grafikkarten zusammen für einen Leistungsschub sorgen, ist dieser bei weitem nicht doppelt so hoch. Aber Sie zahlen doppelt so viel Geld. Am häufigsten beträgt die Produktivitätssteigerung 20–60 %. Und in manchen Fällen kommt es aufgrund des zusätzlichen Rechenaufwands für den Abgleich überhaupt nicht zu einer Steigerung. Aus diesem Grund dürften sich Multikarten-Konfigurationen bei günstigeren Modellen kaum lohnen, da die teurere Grafikkarte in der Regel immer ein paar günstigere Karten übertrifft. Im Allgemeinen ist der Kauf einer SLI/CrossFire-Lösung für die meisten Verbraucher nicht sinnvoll. Wenn Sie jedoch alle Optionen zur Qualitätsverbesserung aktivieren oder mit extremen Auflösungen, beispielsweise 2560 x 1600, spielen möchten und mehr als 4 Millionen Pixel pro Bild berechnen müssen, können Sie auf zwei oder vier gekoppelte Grafikkarten nicht verzichten.

Visuelle Merkmale

Zusätzlich zu den reinen Hardwarespezifikationen können sich verschiedene Generationen und Modelle von GPUs im Funktionsumfang unterscheiden. Beispielsweise wird oft gesagt, dass die Karten der ATi Radeon ). Daher entscheiden sich viele Verbraucher für die eine oder andere Lösung, ohne überhaupt zu wissen, was der Unterschied bedeutet.

Microsoft DirectX- und Shader-Modellversionen

Diese Namen werden am häufigsten in Streitigkeiten verwendet, aber nur wenige Menschen wissen, was sie wirklich bedeuten. Um das zu verstehen, beginnen wir mit der Geschichte der Grafik-APIs. DirectX und OpenGL sind Grafik-APIs, also Anw– offene Codestandards, die für jedermann verfügbar sind.

Vor der Einführung von Grafik-APIs nutzte jeder GPU-Hersteller seinen eigenen Mechanismus zur Kommunikation mit Spielen. Entwickler mussten für jede GPU, die sie unterstützen wollten, separaten Code schreiben. Ein sehr teurer und ineffektiver Ansatz. Um dieses Problem zu lösen, wurden APIs für 3D-Grafiken entwickelt, sodass Entwickler Code für eine bestimmte API und nicht für eine bestimmte Grafikkarte schreiben. Danach fielen den Grafikkartenherstellern Kompatibilitätsprobleme zu, die sicherstellen mussten, dass die Treiber mit der API kompatibel waren.

Die einzige Schwierigkeit besteht weiterhin darin, dass heute zwei unterschiedliche APIs verwendet werden, nämlich Microsoft DirectX und OpenGL, wobei GL für Graphics Library steht. Da die DirectX-API heutzutage in Spielen beliebter ist, werden wir uns darauf konzentrieren. Und dieser Standard hatte einen stärkeren Einfluss auf die Entwicklung von Spielen.

DirectX ist Gründung von Microsoft. Tatsächlich umfasst DirectX mehrere APIs, von denen jedoch nur eine für 3D-Grafiken verwendet wird. DirectX umfasst APIs für Sound, Musik, Eingabegeräte usw. Die Direct3D-API ist für 3D-Grafiken in DirectX verantwortlich. Wenn von Grafikkarten die Rede ist, ist dies gemeint. In dieser Hinsicht sind die Konzepte DirectX und Direct3D austauschbar.

DirectX wird regelmäßig aktualisiert, wenn die Grafiktechnologie Fortschritte macht und Spieleentwickler neue Programmiertechniken für Spiele implementieren. Da DirectX immer beliebter wurde, begannen GPU-Hersteller, neue Produktversionen so anzupassen, dass sie den DirectX-Funktionen Rechnung trugen. Aus diesem Grund sind Grafikkarten häufig an die Hardwareunterstützung der einen oder anderen DirectX-Generation (DirectX 8, 9.0 oder 9.0c) gebunden.

Erschwerend kommt hinzu, dass sich Teile der Direct3D-API im Laufe der Zeit ändern können, ohne dass sich die DirectX-Generationen ändern. Beispielsweise spezifiziert die DirectX 9.0-Spezifikation die Unterstützung für Pixel Shader 2.0. Das DirectX 9.0c-Update enthält jedoch Pixel Shader 3.0. Obwohl die Karten der DirectX 9-Klasse angehören, können sie verschiedene Funktionssätze unterstützen. Beispielsweise unterstützt die Radeon 9700 Shader Model 2.0 und die Radeon X1800 Shader Model 3.0, obwohl beide Karten der DirectX 9-Generation zugeordnet werden können.

Denken Sie daran, dass Entwickler bei der Entwicklung neuer Spiele die Besitzer alter Maschinen und Grafikkarten berücksichtigen, denn wenn Sie dieses Benutzersegment ignorieren, wird das Umsatzniveau geringer ausfallen. Aus diesem Grund sind in Spielen mehrere Codepfade eingebaut. Ein DirectX 9-Spiel hat wahrscheinlich einen DirectX 8-Pfad und aus Kompatibilitätsgründen sogar einen DirectX 7-Pfad. Wenn der alte Pfad ausgewählt wird, verschwinden normalerweise einige der virtuellen Effekte, die auf neuen Grafikkarten vorhanden sind, aus dem Spiel. Aber zumindest kann man auch auf alter Hardware spielen.

Für viele neue Spiele muss die neueste Version von DirectX installiert sein, auch wenn die Grafikkarte einer früheren Generation ist. Das heißt, ein neues Spiel, das den DirectX 8-Pfad verwendet, erfordert weiterhin die Installation der neuesten Version von DirectX 9 für eine Grafikkarte der DirectX 8-Klasse.

Was sind die Unterschiede zwischen verschiedenen Versionen der Direct3D-API in DirectX? Frühe Versionen von DirectX – 3, 5, 6 und 7 – verfügten über relativ einfache Funktionen der Direct3D-API. Entwickler konnten visuelle Effekte aus einer Liste auswählen und dann testen, wie sie im Spiel funktionierten. Der nächste große Schritt in der Grafikprogrammierung war DirectX 8. Es führte die Möglichkeit ein, die Grafikkarte mithilfe von Shadern zu programmieren, sodass Entwickler erstmals die Freiheit hatten, Effekte so zu programmieren, wie sie es benötigten. DirectX 8 unterstützte Versionen von Pixel Shader 1.0 bis 1.3 und Vertex Shader 1.0. DirectX 8.1, eine aktualisierte Version von DirectX 8, erhielt Pixel Shader 1.4 und Vertex Shader 1.1.

In DirectX 9 können Sie noch komplexere Shader-Programme erstellen. DirectX 9 unterstützt Pixel Shader 2.0 und Vertex Shader 2.0. DirectX 9c, eine aktualisierte Version von DirectX 9, enthielt die Pixel Shader 3.0-Spezifikation.

DirectX 10, die kommende API-Version, wird begleiten neue Version Windows Vista. Sie können DirectX 10 nicht unter Windows XP installieren.

HDR-Beleuchtung und OpenEXR HDR

HDR steht für „High Dynamic Range“. Ein Spiel mit HDR-Beleuchtung kann ein viel realistischeres Bild erzeugen als ein Spiel ohne HDR-Beleuchtung, und nicht alle Grafikkarten unterstützen HDR-Beleuchtung.

Vor der Einführung von DirectX 9-Grafikkarten waren GPUs durch die Genauigkeit ihrer Beleuchtungsberechnungen stark eingeschränkt. Bisher konnte die Beleuchtung nur mit 256 (8 Bit) internen Pegeln berechnet werden.

Als DirectX-9-Grafikkarten auf den Markt kamen, waren sie in der Lage, Beleuchtung mit hoher Präzision zu erzeugen – volle 24 Bit oder 16,7 Millionen Stufen.

Mit 16,7 Millionen Stufen und der nächsten Leistungssteigerung von DirectX 9/Shader Model 2.0-Grafikkarten wurde HDR-Beleuchtung auf Computern möglich. Dies ist eine ziemlich komplexe Technologie, die Sie dynamisch beobachten müssen. Wenn wir reden in einfachen Worten, dann erhöht HDR-Beleuchtung den Kontrast (dunkle Farbtöne erscheinen dunkler, helle Farbtöne erscheinen heller) und erhöht gleichzeitig die Menge an Beleuchtungsdetails in dunklen und hellen Bereichen. Das Spiel mit HDR-Beleuchtung wirkt lebendiger und realistischer als ohne.

GPUs, die mit der neuesten Pixel Shader 3.0-Spezifikation kompatibel sind, ermöglichen Beleuchtungsberechnungen mit höherer 32-Bit-Präzision und Gleitkommamischung. Somit können Grafikkarten der SM 3.0-Klasse eine spezielle OpenEXR HDR-Beleuchtungsmethode unterstützen, die speziell für die Filmindustrie entwickelt wurde.

Einige Spiele, die nur OpenEXR HDR-Beleuchtung unterstützen, laufen nicht mit HDR-Beleuchtung auf Shader Model 2.0-Grafikkarten. Spiele, die nicht auf die OpenEXR-Methode angewiesen sind, laufen jedoch auf jeder DirectX-9-Grafikkarte. Oblivion verwendet beispielsweise die OpenEXR-HDR-Methode und erlaubt HDR-Beleuchtung nur auf den neuesten Grafikkarten, die die Shader Model 3.0-Spezifikation unterstützen. Zum Beispiel nVidia GeForce 6800 oder ATi Radeon X1800. Spiele, die die 3D-Engine von Half-Life 2 verwenden, darunter Counter-Strike: Source und das kommende Half-Life 2: Aftermath, ermöglichen die Aktivierung von HDR-Rendering auf älteren DirectX 9-Grafikkarten, die nur Pixel Shader 2.0 unterstützen. Beispiele hierfür sind die GeForce 5- oder ATi Radeon 9500-Reihe.

Bedenken Sie schließlich, dass alle Formen des HDR-Renderings erhebliche Rechenleistung erfordern und selbst die leistungsstärksten GPUs in die Knie zwingen können. Wenn du spielen willst neueste Spiele Mit HDR-Beleuchtung können Sie auf eine leistungsstarke Grafik nicht verzichten.

Vollbild-Anti-Aliasing

Mit Vollbild-Anti-Aliasing (kurz AA) können Sie die charakteristischen „Leitern“ an den Grenzen von Polygonen beseitigen. Beachten Sie jedoch, dass das Anti-Aliasing im Vollbildmodus viel kostet Rechenressourcen, was zu einem Rückgang der Bildrate führt.

Anti-Aliasing hängt stark von der Leistung des Videospeichers ab, sodass eine Hochgeschwindigkeits-Grafikkarte mit schnellem Speicher das Anti-Aliasing im Vollbildmodus mit weniger Auswirkungen auf die Leistung berechnen kann als eine kostengünstige Grafikkarte. Antialiasing kann in verschiedenen Modi aktiviert werden. Beispielsweise führt 4-faches Antialiasing zu einem besseren Bild als 2-faches Antialiasing, beeinträchtigt jedoch die Leistung erheblich. Während 2x Antialiasing die horizontale und vertikale Auflösung verdoppelt, vervierfacht der 4x-Modus sie.

Texturfilterung

Texturen werden auf alle 3D-Objekte im Spiel angewendet. Je größer der Winkel der angezeigten Oberfläche ist, desto verzerrter sieht die Textur aus. Um diesen Effekt zu beseitigen, verwenden GPUs Texturfilterung.

Die erste Filtermethode hieß bilinear und erzeugte charakteristische Streifen, die für das Auge nicht sehr angenehm waren. Die Situation verbesserte sich mit der Einführung der trilinearen Filterung. Beide Optionen funktionieren auf modernen Grafikkarten praktisch ohne Leistungseinbußen.

Die meisten von heute der beste Weg Bei der Texturfilterung handelt es sich um eine anisotrope Filterung (AF). Wie beim Vollbild-Antialiasing kann auch die anisotrope Filterung auf verschiedenen Ebenen aktiviert werden. Beispielsweise bietet 8x AF eine bessere Filterqualität als 4x AF. Wie Vollbild-Antialiasing erfordert die anisotrope Filterung eine gewisse Rechenleistung, die mit zunehmender AF-Stufe zunimmt.

Hochauflösende Texturen

Alle 3D-Spiele werden unter Berücksichtigung spezifischer Spezifikationen erstellt, und eine dieser Anforderungen bestimmt den Texturspeicher, den das Spiel benötigt. Alle notwendigen Texturen müssen während des Spiels in den Speicher der Grafikkarte passen, sonst sinkt die Leistung erheblich, da der Zugriff auf die Texturen in RAM führt zu einer erheblichen Verzögerung, ganz zu schweigen von der Auslagerungsdatei auf der Festplatte. Wenn ein Spieleentwickler also mit 128 MB Videospeicher rechnet minimale Anforderungen, dann sollte der Satz aktiver Texturen zu keinem Zeitpunkt 128 MB überschreiten.

Moderne Spiele verfügen über mehrere Textursätze, sodass das Spiel sowohl auf älteren Grafikkarten mit weniger Videospeicher als auch auf neuen Karten mit mehr Videospeicher problemlos läuft. Beispielsweise kann ein Spiel drei Textursätze enthalten: für 128 MB, 256 MB und 512 MB. Heutzutage gibt es nur sehr wenige Spiele, die 512 MB Videospeicher unterstützen, aber sie sind immer noch der objektivste Grund, eine Grafikkarte mit dieser Speichermenge zu kaufen. Während sich die Speichererweiterung kaum oder gar nicht auf die Leistung auswirkt, profitieren Sie von einer verbesserten visuellen Qualität, wenn das Spiel die entsprechenden Texturen unterstützt.

Was müssen Sie über Grafikkarten wissen?

In Kontakt mit

Vielleicht sind diese Blöcke jetzt die Hauptbestandteile des Videochips. Sie führen spezielle Programme aus, die als Shader bekannt sind. Wenn darüber hinaus frühere Pixel-Shader Pixel-Shader-Blöcke und Vertex-Shader Vertex-Blöcke ausführten, dann wurden die grafischen Architekturen für einige Zeit vereinheitlicht, und diese universellen Recheneinheiten begannen, sich mit verschiedenen Berechnungen zu befassen: Vertex-, Pixel-, geometrische und sogar universelle Berechnungen.

Erstmals kam die einheitliche Architektur im Videochip einer Spielekonsole zum Einsatz Microsoft Xbox 360 wurde diese GPU von ATI entwickelt (später von AMD übernommen). Und in Videochips für persönliche Computer Im NVIDIA GeForce 8800-Board erschienen einheitliche Shader-Einheiten. Und seitdem basieren alle neuen Videochips auf einer einheitlichen Architektur, die über universellen Code für verschiedene Shader-Programme (Vertex, Pixel, Geometrie usw.) und die entsprechenden einheitlichen Prozessoren verfügt kann jedes Programm ausführen.

Anhand der Anzahl der Recheneinheiten und ihrer Häufigkeit können Sie die mathematische Leistung verschiedener Grafikkarten vergleichen. Die meisten Spiele sind mittlerweile durch die Leistung von Pixel-Shadern begrenzt, daher ist die Anzahl dieser Blöcke sehr wichtig. Wenn beispielsweise ein Grafikkartenmodell in seiner Zusammensetzung auf einer GPU mit 384 Rechenprozessoren basiert und ein anderes Modell derselben Linie über eine GPU mit 192 Recheneinheiten verfügt, ist das zweite bei derselben Frequenz doppelt so langsam bei der Verarbeitung Art von Shader, und im Allgemeinen wird die gleiche produktiver sein.

Allein aus der Anzahl der Recheneinheiten lässt sich zwar kein eindeutiger Rückschluss auf die Leistung ziehen, es gilt jedoch, die Taktfrequenz und die unterschiedliche Architektur von Geräten unterschiedlicher Generationen und Chiphersteller zu berücksichtigen. Nur anhand dieser Zahlen können Sie Chips nur innerhalb derselben Produktlinie eines Herstellers vergleichen: AMD oder NVIDIA. In anderen Fällen müssen Sie auf Leistungstests in den Spielen oder Anwendungen achten, die Sie interessieren.

Texturierungseinheiten (TMU)

Diese GPU-Einheiten arbeiten mit Computerprozessoren zusammen; sie wählen und filtern Texturen und andere Daten, die für den Szenenaufbau und allgemeine Berechnungen erforderlich sind. Die Anzahl der Textureinheiten in einem Videochip bestimmt die Texturleistung – also die Geschwindigkeit beim Abrufen von Texeln aus Texturen.

Obwohl in letzter Zeit mehr Wert auf mathematische Berechnungen gelegt wird und einige Texturen durch prozedurale ersetzt werden, ist die Belastung der TMU-Blöcke immer noch recht hoch, da zusätzlich zu den Haupttexturen auch eine Auswahl aus Normal- und Displacement-Maps getroffen werden muss. sowie Renderziel-Renderpuffer außerhalb des Bildschirms.

Angesichts der Tatsache, dass bei vielen Spielen der Schwerpunkt auf der Leistung von Texturierungseinheiten liegt, können wir sagen, dass auch die Anzahl der TMU-Einheiten und die entsprechende hohe Texturierungsleistung eine Rolle spielen die wichtigsten Parameter für Videochips. Dieser Parameter hat einen besonderen Einfluss auf die Geschwindigkeit der Bildwiedergabe bei Verwendung der anisotropen Filterung, die zusätzliche Texturmuster erfordert, sowie bei komplexen Soft-Shadow-Algorithmen und neuen Algorithmen wie Screen Space Ambient Occlusion.

Rasterization Operation Units (ROPs)

Rasterisierungseinheiten führen die Vorgänge des Schreibens der von der Grafikkarte berechneten Pixel in Puffer und die Vorgänge ihrer Mischung (Blending) aus. Wie oben erwähnt, beeinflusst die Leistung von ROP-Blöcken die Füllrate und dies ist eines der Hauptmerkmale von Grafikkarten aller Zeiten. Und obwohl seine Bedeutung in letzter Zeit ebenfalls etwas abgenommen hat, gibt es immer noch Fälle, in denen die Anwendungsleistung von der Geschwindigkeit und Anzahl der ROP-Blöcke abhängt. Meistens ist dies auf die aktive Verwendung von Nachbearbeitungsfiltern und aktiviertem Anti-Aliasing bei hohen Spieleinstellungen zurückzuführen.

GPU-Architektur: Funktionen

Der Realismus von 3D-Grafiken hängt stark von der Leistung der Grafikkarte ab. Je mehr Pixel-Shader-Blöcke der Prozessor enthält und je höher die Frequenz, desto mehr Effekte können auf die 3D-Szene angewendet werden, um deren visuelle Wahrnehmung zu verbessern.

Die GPU enthält viele verschiedene Funktionsblöcke. Anhand der Anzahl einiger Komponenten können Sie abschätzen, wie leistungsfähig die GPU ist. Bevor wir fortfahren, werfen wir einen Blick auf die wichtigsten Funktionsblöcke.

Vertex-Prozessoren (Vertex-Shader-Einheiten)

Wie Pixel-Shader-Einheiten führen Vertex-Prozessoren Shader-Code aus, der Scheitelpunkte berührt. Da ein größeres Vertex-Budget die Erstellung komplexerer 3D-Objekte ermöglicht, ist die Leistung von Vertex-Prozessoren in 3D-Szenen mit komplexen oder vielen Objekten sehr wichtig. Allerdings haben Vertex-Shader-Einheiten immer noch keinen so offensichtlichen Einfluss auf die Leistung wie Pixelprozessoren.

Pixelprozessoren (Pixel-Shader-Einheiten)

Ein Pixelprozessor ist eine Komponente eines Grafikchips, die für die Verarbeitung von Pixel-Shader-Programmen bestimmt ist. Diese Prozessoren führen Berechnungen durch, die nur Pixel betreffen. Da Pixel Farbinformationen enthalten, können Sie mit Pixel-Shadern beeindruckende grafische Effekte erzielen. Beispielsweise werden die meisten Wassereffekte, die Sie in Spielen sehen, mithilfe von Pixel-Shadern erstellt. Typischerweise wird die Anzahl der Pixelprozessoren verwendet, um die Pixelleistung von Grafikkarten zu vergleichen. Wenn eine Karte über acht Pixel-Shader-Einheiten und eine andere über 16 Einheiten verfügt, ist es logisch anzunehmen, dass eine Grafikkarte mit 16 Einheiten bei der Verarbeitung komplexer Pixel-Shader-Programme schneller ist. Auch die Taktrate sollte berücksichtigt werden, allerdings ist heute eine Verdoppelung der Anzahl der Pixelprozessoren energieeffizienter als eine Verdoppelung der Frequenz des Grafikchips.

Einheitliche Shader

Unified Shader sind in der PC-Welt noch nicht angekommen, aber der kommende DirectX 10-Standard basiert auf einer ähnlichen Architektur. Das heißt, die Codestruktur von Vertex-, Geometrie- und Pixelprogrammen ist dieselbe, obwohl Shader unterschiedliche Aufgaben ausführen. Zu sehen ist die neue Spezifikation bei der Xbox 360, deren GPU speziell von ATi für Microsoft entwickelt wurde. Es wird sehr interessant sein zu sehen, welches Potenzial das neue DirectX 10 mit sich bringt.

Texture Mapping Units (TMU)

Texturen sollten ausgewählt und gefiltert werden. Diese Arbeit wird von Texture-Mapping-Einheiten übernommen, die in Verbindung mit Pixel- und Vertex-Shader-Einheiten arbeiten. Die Aufgabe der TMU besteht darin, Texturoperationen auf Pixel anzuwenden. Die Anzahl der Textureinheiten in einer GPU wird oft verwendet, um die Texturleistung von Grafikkarten zu vergleichen. Man kann davon ausgehen, dass eine Grafikkarte mit mehr TMUs eine bessere Texturleistung liefert.

Raster-Operator-Einheiten (ROP)

Rasterprozessoren sind für das Schreiben von Pixeldaten in den Speicher verantwortlich. Die Geschwindigkeit, mit der dieser Vorgang ausgeführt wird, ist die Füllrate. In den frühen Tagen der 3D-Beschleuniger waren ROP und Füllrate sehr wichtige Merkmale von Grafikkarten. Heutzutage ist die ROP-Arbeit immer noch wichtig, aber die Leistung der Grafikkarte wird nicht mehr wie früher durch diese Blöcke eingeschränkt. Daher wird die Leistung (und Anzahl) von ROPs selten zur Bewertung der Geschwindigkeit einer Grafikkarte herangezogen.

Förderer

Pipelines werden verwendet, um die Architektur von Grafikkarten zu beschreiben und eine sehr klare Vorstellung von der Leistung der GPU zu vermitteln.

„Förderer“ kann nicht als strenger Fachbegriff betrachtet werden. Die GPU verwendet verschiedene Pipelines, die unterschiedliche Funktionen ausführen. Historisch gesehen bedeutete eine Pipeline einen Pixelprozessor, der mit seiner Texture Mapping Unit (TMU) verbunden war. Beispielsweise verwendet die Radeon 9700-Grafikkarte acht Pixelprozessoren, von denen jeder mit seiner eigenen TMU verbunden ist, sodass davon ausgegangen wird, dass die Karte über acht Pipelines verfügt.

Moderne Prozessoren lassen sich jedoch nur sehr schwer durch die Anzahl der Pipelines beschreiben. Im Vergleich zu früheren Designs verwenden die neuen Prozessoren einen modularen, fragmentierten Aufbau. Als Innovator auf diesem Gebiet gilt ATi, das mit der X1000-Grafikkartenreihe auf einen modularen Aufbau umgestiegen ist, der es ermöglicht, durch interne Optimierung Leistungssteigerungen zu erzielen. Einige CPU-Blöcke werden häufiger genutzt als andere, und um die GPU-Leistung zu verbessern, hat ATi versucht, einen Kompromiss zwischen der Anzahl der benötigten Blöcke und der Chipfläche (die nicht sehr viel vergrößert werden kann) zu finden. In dieser Architektur hat der Begriff „Pixelpipeline“ bereits seine Bedeutung verloren, da die Pixelprozessoren nicht mehr an eigene TMUs angeschlossen sind. Beispielsweise verfügt die ATi Radeon X1600 GPU über 12 Pixel-Shader-Einheiten und nur vier TMU-Textur-Mapping-Einheiten. Daher kann man nicht sagen, dass die Architektur dieses Prozessors über 12-Pixel-Pipelines verfügt, und man kann auch nicht sagen, dass es nur vier davon gibt. Traditionell wird jedoch immer noch von Pixel-Pipelines gesprochen.

Unter Berücksichtigung der oben genannten Annahmen wird die Anzahl der Pixel-Pipelines in einer GPU häufig zum Vergleich von Grafikkarten herangezogen (mit Ausnahme der ATi X1x00-Reihe). Wenn Sie beispielsweise Grafikkarten mit 24 und 16 Pipelines nehmen, kann man durchaus davon ausgehen, dass die Karte mit 24 Pipelines schneller ist.


INHALT

Worum geht es in diesem kurzen Artikel?

Bei diesem Artikel handelt es sich um eine Reihe grundlegender Kenntnisse für diejenigen, die eine ausgewogene Grafikkarte auswählen möchten, ohne den Vermarktern zusätzliches Geld zu zahlen. Es hilft Anfängern und dient auch als Quelle nützlicher Informationen für fortgeschrittene PC-Benutzer. Der Miniartikel ist jedoch immer noch präzise fokussiert für Anfänger.

Der Zweck der Grafikkarte.

Es ist kein Geheimnis, dass in unserer Zeit das Haupttätigkeitsfeld einer produktiven Grafikkarte darin besteht: 3 DSpiele, flüssige Wiedergabe Video( HD ), beruflich arbeiten 3D2D und Videoeditoren. Andere Alltagsaufgaben lassen sich problemlos mit im Prozessor oder Chipsatz integrierten Grafikkarten erledigen. In letzter Zeit hat sich das Tätigkeitsfeld für Grafikkarten erweitert, und zwar in Form von Multithread-Computing, die auf der parallelen Architektur von Grafikkarten viel schneller laufen als auf Prozessoren.

NVIDIAbewirbt seine Software- und HardwareplattformCUDAsprachbasiert Si (Übrigens war es erfolgreich, und das ist angesichts der Investition dieser und jener Mittel nicht verwunderlich).AMDsetzt jedoch hauptsächlich auf Open SourceOpenCL.

Mit Hilfe Sie können Videos kodieren 3-4 mal schneller. Beschleunigen Sie die Produkte des Unternehmens mithilfe von Hardware und GrafikkartenAdobe- insbesondere Photoshop, Blitz, und das ist offenbar erst der Anfang. Stimmt, die Leute, die es ständig benutzen Rechenleistung Es gibt theoretisch nur sehr wenige Grafikkarten. Und es schien zu früh, darüber nachzudenken, zumal sie ihnen auf die Füße treten vielnuklear Prozessoren, die bei Multithread-Operationen zwar langsamer sind, aber den unbestreitbaren Vorteil haben, dass sie einfach ihre Arbeit erledigen, ohne dass komplexe Softwareoptimierungen erforderlich sind. Und Einfachheit und einfache Implementierung, wie die Geschichte zeigtWindows(zum Beispiel) – die Hauptsache für Menschen und der Schlüssel zum Erfolg Software Markt. Und es lohnt sich trotzdem, die Rechenleistung von Grafikkarten zu würdigen, die durch die „richtige“ Software noch nicht gebremst wurde.

Also. NVIDIAoderAMD?

*Die „interessanteste“ Frage

Die Hauptakteure auf dem Markt für Grafikbeschleuniger sind UnternehmenAMD Und NVIDIA.


Hier ist alles klar, wie in vielen Marktsektoren, Duopol. Wie Pepsi Und Coca Cola, sowie Xbox 360 , Wie Intel Und AMD schließlich. In letzter Zeit haben Unternehmen ihre Produkte einzeln auf den Markt gebracht. Dann, damit es dem einen gut geht und dem anderen auch gut. Anfangs AMD bringt das Flaggschiff der Linie auf den Markt und zwei oder drei Monate später ein leistungsstärkeres Flaggschiff NVIDIA. Zunächst werden Karten gekauft AMD, als der mächtigste, dann nach der Veröffentlichung der Karten NVIDIA Diejenigen, die sie gekauft haben, gehen zurück in den Laden, um ein noch besseres Produkt zu erhalten. Fast das Gleiche passiert mit den Mittel- und Budgetmärkten. Nur der Unterschied in der Leistungssteigerung gegenüber der Konkurrenz ist hier höher, denn um einen preisbewussteren Verbraucher zu interessieren, bedarf es mehr als der Chance auf eine bessere Grafikkarte, wie es im Flaggschiff-Bereich der Fall ist.

Es ist besser, kein Fan zu sein, denn das ist geschäftlich und nichts Persönliches. Die Hauptsache ist, dass die Grafikkarten produktiv sind und die Preise nicht beißen. Und welcher Hersteller ist nicht wichtig. Mit diesem Ansatz können Sie in Sachen Preis und Leistung immer gewinnen.

Chip-Architektur.

MengePixelprozessoren (für AMD ), Universalförderer (Für NVidia).

Ja. Das sind völlig unterschiedliche Dinge. Was AMD hat Radeon HD 5870 1600 Ausführungseinheiten bedeuten keineswegs, dass es dreimal leistungsfähiger sein wird alsNVidia GTX 480 was an Bord hat 480 Exekutivblöcke.

NVIDIAEs hat Skalar Architektur undAMDSuperskalar .

AMD-Architektur.

Betrachten wir die Architektur PP (*Pixelprozessoren),am Beispiel der grundlegenden superskalaren Architektur von GrafikkartenRadeon HD 5 Episoden ( 5-Wege-VLIW).


Jeden 5 S stellen eine Ausführungseinheit dar, die jeweils maximal ausführen kann - 1 Skalar Chirurgie und 1 Vektor oder manchmal 5 Skalar(Allerdings sind die Bedingungen hierfür nicht immer geeignet). Jede Vektoroperation erfordert 4 PP, jeder Skalar 1 PP. Und dann, wie es weitergeht. UNVIDIA gleich, alle Cuda Core, führt streng nach 1 Vektor Und 1 Skalar Operationen pro Taktzyklus.

Mit der Veröffentlichung von Episode 6 unter dem Codenamen ( Nördliche Inseln ), nämlich Cayman-Chips, beschlossen, auf die zusätzliche fünfte zu verzichtenALU(T-Einheit), der für die Ausführung komplexer Aufgaben verantwortlich war.

Jetzt können drei der vier verbleibenden Blöcke diese Rolle übernehmen. Dadurch konnte der Threadmanager entlastet werden ( Ultra-Threaded-Versandprozessor), die zusätzlich verdoppelt wurden, um die Arbeit mit Geometrie und Tessellation zu verbessern, die den Schwachpunkt der 5er-Serie darstellten. Darüber hinaus können Sie bei gleicher Effizienz Kernfläche und Transistorbudget einsparen.

Arbeiten Sie nach der sechsten Episode an der Entwicklung VLIW wurde aufgrund der geringen Flexibilität und der großen Ausfallzeit aufgrund der Abhängigkeiten interner Blöcke voneinander (insbesondere Vektoroperationen) beendet. Eine völlig neue Architektur ist in den Vordergrund gerückt Grafikkern als Nächstes .

Motor SIMD, wird durch eine Recheneinheit ersetzt Recheneinheit (C.U.), was die Effizienz und Leistung der Architektur deutlich steigern kann. Jeder PP kann nun unabhängig Vektor- und Skalaroperationen durchführen, da für ihn separate Kontrollblöcke eingeführt wurden, die Ressourcen effizienter auf freie Blöcke verteilen. Im Allgemeinen beginnt die Architektur, einige der Prämissen der Skalararchitektur zu übernehmen NVIDIA, was einfach und effektiv ist.

Der erste Chip mit der neuen Architektur war GPU Tahiti, auf dem sie aufgebaut sind AMD Radeon HD 7970/7950 . Das Unternehmen plant die Veröffentlichung eines Mittelklassemodells auf Basis der neuen Architektur.

Schauen wir uns nun das Grundlegende an: Skalare Architektur NVIDIA .


Wie wir sehen, ist jeder Universalprozessor ( ), tritt pro Takt auf 1 Skalaroperation und 1 Vektor Dies ermöglicht maximale Glätte. Wo es viele Vektor- und Skalaroperationen gibt, GrafikkartenAMD mit Architektur VLIWminderwertig, weil sie nicht in der Lage sind, ihre Blöcke mit Arbeit wie Grafikkarten zu ladenNVIDIA.

Nehmen wir an, die Wahl liegt zwischenRadeon HD 5870 Und GeForce GTX 480 .

Am Anfang 1600 Seiten, der Zweite 480 einheitliche Blöcke.

Wir berechnen: 16005=320 superskalare Blöcke, y Radeon HD 5870.

Das heißt, pro Taktzyklus schaltet die Grafikkarte abAMD, wird ausgeführt von 320 bis 1600 Skalare Operationen und von 0 bis 320 schwebender Vektor, abhängig von der Art der Aufgabe.

Und mit der doppelten Frequenz der Shader-Domäne, der Karte auf der ArchitekturFermi, sollte theoretisch erfüllt sein 960 Vektor und 960 Skalare Operationen pro Taktzyklus.

Jedoch Radeon hat eine günstigere Häufigkeit als die Karte aus dem „grünen Lager“ (700 gegenüber 850). Das sind also die IndikatorenNVIDIA, sollte theoretisch derselbe sein wie wenn die Shader-Domäne mit 1700 MHz (850 MHz) betrieben wird X 2=1700), aber das ist nicht so. Bei einer Frequenz von 1401 MHz, GTX 480 gibt ~ 700 Vektor und ~ 700 Skalare Operationen pro Taktzyklus.

* Sie sollten sich nicht auf die Zuverlässigkeit dieser Berechnungen verlassen, sie sind nur theoretisch. Darüber hinaus gilt diese Aussage ab der 6. Serie nicht mehr Radeon Beginnend mit Chips Kaiman.

Aufgrund der Tatsache, dass Höchstbetrag Es werden gleich viele Vektor- und Skalaroperationen ausgeführt, ArchitekturNVIDIAhat das Beste Glätte in schwierigen Szenen als AMD VLIW (<5 series).

Preiskategorien und was wir bekommen, wenn wir eine Grafikkarte einer niedrigeren Serie kaufen.

Ingenieure AMDOhne zu zögern haben sie die Hälfte der Pixelprozessoren, den Speicherbus und einen Teil gestrichenROP'S Generation von Karten, aus einem Segment eine Klasse tiefer. Z.BRadeon HD5870 Es hat 1600 Seiten, Reifen 256 bisschen, und in 577 0, genau die Hälfte davon bleibt übrig - 800 und Speicherbus 128 bisschen. Die gleiche Situation besteht auch bei den preisgünstigsten Grafikkarten. Daher ist es immer besser, eine schwächere Grafikkarte aus der 58**-Serie zu kaufen als die leistungsstärkste aus der 57**-Serie.

Von Ingenieuren NVIDIA, kein viel anderer Ansatz. Reibungslos, Speicherbus, Universal-Pipelines werden getrimmt,ROP'S , Pixelpipelines. Allerdings sinken auch die Frequenzen, was bei einem ordentlichen Kühlsystem durch Übertaktung leicht ausgeglichen werden kann. Es ist ein wenig seltsam, dass es nicht umgekehrt ist, wie es der Fall istAMD, Erhöhung der Frequenzen auf Karten mit einer reduzierten Anzahl von Aktoren.

Ein Ansatz AMD für den Hersteller vorteilhafterer Ansatz NVIDIA- an den Käufer.

Erwähnung von Fahrern.

Dies liegt genau an den Merkmalen der superskalaren Architektur VLIW, Fahrer von AMD, müssen Sie ständig optimieren, damit die Grafikkarte versteht, wann sie Vektoren oder Skalare so effizient wie möglich verwenden muss.

Einheitliche Treiber vonNVIDIAimmun gegen verschiedene Spiel-Engines, dank der Tatsache, dass IngenieureNVIDIAOftmals optimieren sie bereits bei der Entwicklung eines Spiels dieses für die Architektur ihrer Videochips und Treiber. Erwähnenswert ist auch, dass beim Ein- und Ausbau praktisch keine Probleme auftreten, die den Treibern von eigen sindAMD.

Treiber NVIDIA Sie können direkt auf alten installieren, ohne die Registrierung zu deinstallieren oder zu bereinigen. Wir hoffen, dass ProgrammiererAMDwird sich in die gleiche Richtung bewegen. Jetzt können Sie „Fixes“ für Treiber herunterladenKatalysator, die kurz vor dem Verkaufsstart des Spiels oder etwas später veröffentlicht werden. Schon was. Und mit der Veröffentlichung der neuen Architektur Grafikkern als Nächstes, wird die Arbeit der Treiberoptimierung viel einfacher.

Pixelförderer, TMU, ROP.

Auch die Anzahl ist sehr wichtig Pixel-Pipelines Und TMU (Textur-Mapping-Block), ihre Anzahl ist besonders wichtig bei hohen Auflösungen und bei Verwendung anisotroper Texturfilterung ( Pixelpipelines sind wichtig), unter Verwendung hochwertiger Texturen und hoher anisotroper Filtereinstellungen (TMUs sind wichtig).

Anzahl der BlöckeROP (Rasteroperationsblöcke ), Diese wirken sich hauptsächlich auf die Anti-Aliasing-Leistung aus. Wenn sie jedoch mangelhaft sind, kann es zu einem Verlust der Gesamtleistung kommen. Je mehr es sind, desto unmerklicher wirkt sich das Anti-Aliasing auf die Anzahl der Bilder pro Sekunde aus. Außerdem hat die Größe des Videospeichers erheblichen Einfluss auf die Anti-Aliasing-Leistung.

Lautstärke, Frequenz und Bittiefe des Speicherbusses.

Je mehr Videospeicher eine Grafikkarte hat, desto besser. Es lohnt sich jedoch nicht in großen Mengen kaufen.

Wie so oft sind relativ schwache Grafikkarten mit unglaublich viel Videospeicher ausgestattet, und selbst langsame (z. B. aufGeForce 8500 GT, manche OEMHersteller eingestellt 2 GB DDR2 Videospeicher). Dadurch wird die Grafikkarte nicht ausgeschaltet und die Leistung wird nicht verbessert.

* im Vergleich zu 8500 GT 512 MB

Eine viel bessere Option wäre die Verwendung einer Grafikkarte mit schnellerem Speicher, aber geringerer Kapazität. Wenn zum Beispiel die Wahl lautet: nehmen 9800 GTMit 512 oder 1024 MB Erinnerung, mit Frequenz 1000 MHz Und 900 MHz Dementsprechend wäre es vorzuziehen, 9800 zu nehmen GT Mit 512 MB Erinnerung. Darüber hinaus benötigt eine Grafikkarte dieser Stufe nicht mehr Videospeicher als 512 MB.

Speicherbandbreite – Dies ist der wichtigste Faktor für die Leistung des Videospeicher-Subsystems, das sich vor allem auf die Leistung der Grafikkarte insgesamt auswirkt. Gemessen in Gb/s (Gigabyte pro Sekunde).

Zum Beispiel jetzt Videospeicher wieDDR5 , das ein viel höheres Frequenzpotential hat alsDDR3 und dementsprechend weißeres High Durchsatz.

Allerdings ist die Häufigkeit nicht alles. Der zweite wichtige Faktor ist Breite des Speicherbusses. Je höher die Bittiefe, desto schneller ist der Speicher.

Zum Beispiel Gedächtnis mit einer Frequenz 1000 MHz und Reifen 256 bisschen, wird genau 2 Mal sein Schneller Erinnerung 1000 MHz und Reifen 128 bisschen. Je höher die Bittiefe, desto schneller ist der Speicher. Der breiteste Speicherbus, den es gibt, ist monströs 896 bisschen(448 X2 ) auf der Grafikkarte GeForce GTX295 . Es verbraucht jedoch SpeicherDDR3 , was den Durchsatz im Vergleich zu erheblich verschlechtert (geringere effektive Frequenz).DDR5 . Daher ist sein Durchsatz sogar etwas geringer als der vonRadeon HD 5970 Mit 512 bisschen(256 x 2), aber mit DDR5 .

Kühlsystem.

Je effizienter das Kühlsystem ist, desto geringer ist die Wahrscheinlichkeit, dass Ihre Grafikkarte ausfällt. Die Karte überhitzt weniger, was die Gesamtstabilität des Systems deutlich verbessert Lebensdauer, und wird auch zunehmen Übertaktungspotenzial.

Produziert, fertigMitSysteme Ö Es gibt zwei Varianten der Grafikkartenkühlung.



Referenz (vom Hersteller) und Alternative (von den Partnern des Herstellers). Referenzkarten sind in der Regel als Turbine (Gebläse) konzipiert und in der Regel sehr zuverlässig. Relativ laut, nicht immer so effektiv wie Alternative CO von den Partnern des Herstellers und verstopfen sich stärker durch Staub. Obwohl Gebläsekühlsysteme für Grafikkarten im Einsatz sehr effizient und leise sind. Wenn Sie ein wenig Lärm unter Last nicht stört und Sie keine Übertaktungsrekorde aufstellen wollen, sind Referenz-Kühlsysteme vorzuziehen. Üblicherweise bekleben Herstellerpartner sie mit Aufklebern mit ihren Logos; Änderungen sind nur im BIOS der Grafikkarte möglich (Anpassung der Lüftergeschwindigkeit), daher sind manche Karten baugleich, aber von unterschiedlichen Herstellern, lauter oder heißer als ihre Gegenstücke und und umgekehrt. Jeder Hersteller hat seine eigenen Präferenzen und Garantiebedingungen. Daher opfern einige die Geräuschlosigkeit für mehr Stabilität und Haltbarkeit.



Wenn es Ihnen wichtig ist Schweigen, dann sollten Sie darauf achten alternative Systeme erhöhte Kühleffizienz, mit weniger Lärm (z.BDampf - x, IceQ, , DirectCu) oder wählen Sie eine Grafikkarte mit passivem Kühlsystem, von denen es mittlerweile immer mehr gibt.

* Beratung: Vergessen Sie nicht, die Wärmeschnittstelle alle ein bis zwei Jahre zu wechseln, insbesondere auf CO mit direkter Heatpipe-Kontakttechnologie. Die Wärmeleitpaste härtet aus und bildet eine Schicht, die die Wärme nicht gut leitet, was zur Überhitzung der Grafikkarte führt.

Stromverbrauch der Grafikkarte.

Ein sehr wichtiges Merkmal bei der Auswahl, da die Grafikkarte eine sehr stromhungrige Komponente des Computers ist, wenn nicht sogar die stromhungrigste. Top-Grafikkarten erreichen manchmal das Ziel 300W. Daher sollten Sie bei der Auswahl berücksichtigen, ob Ihr Netzteil in der Lage ist, die Grafikkarte stabil mit Strom zu versorgen. Andernfalls kann es sein, dass das System aufgrund einer Spannungsinkongruenz beim Durchfahren nicht startet POST Es kann zu Instabilität im Betrieb und unerwarteten Abschaltungen, Neustarts oder Überhitzung von Computerkomponenten kommen, oder das Netzteil kann einfach durchbrennen.

Auf der Website des Herstellers oder auf der Verpackung der Grafikkarte sind die Mindesteigenschaften angegeben, einschließlich der Mindestleistung des Netzteils. Diese Werte werden für alle Blöcke geschrieben, auch für chinesische. Wenn Sie sicher sind, dass Sie über ein hochwertiges Netzteil verfügen, können Sie von diesem Wert abziehen 50-100W.

Sie können den Stromverbrauch indirekt anhand der Anzahl zusätzlicher Stromanschlüsse auf der Grafikkarte bestimmen.

Nichts – weniger 75W, eins 6-polig Vor 150W, zwei 6-polig Vor 225W, 8-polig + 6-polig - Vor 300W. Stellen Sie sicher, dass Ihr Gerät über die erforderlichen Anschlüsse verfügt oder dass das Kit Adapter für 4-polig enthält Molex-S. Oder kaufen Sie sie, sie werden in Computergeschäften frei verkauft.

Eine unzureichende Stromversorgung der Grafikkarte kann zu Überhitzung, dem Auftreten von Artefakten und dem Ausfall ihres Stromversorgungssystems führen. Grafikkarten NVIDIA Wenn es an Strom mangelt, beginnen sie möglicherweise mit Meldungen wie „Der Grafiktreiber reagiert nicht mehr und wurde wiederhergestellt“ oder „Schließen Sie zusätzliche Stromversorgung an die Grafikkarte an.“ zu warnen.

Hoher Stromverbrauch = hohe Wärmeableitung. Wenn Ihre Grafikkarte viel Strom verbraucht, sorgen Sie für zusätzliche Ansaug- und Abluftventilatoren am Gehäuse. Oder öffnen Sie als vorübergehende Maßnahme die Seitenabdeckung. Ständig hohe Temperaturen im Gehäuse wirken sich nachteilig auf die Lebensdauer aller Komponenten aus, vom Motherboard bis zum Motherboard.

Anschlüsse.

Wenn Sie sich bereits für eine Grafikkarte entschieden haben, sollten Sie auf die Anschlüsse achten.


Wenn Sie einen Monitor mit Matrix haben P- oder mit Unterstützung 30-Bit-Farbe (1,07 Milliarden), dann wirst du es auf jeden Fall brauchen DisplayPort auf der Grafikkarte, um ihr Potenzial auszuschöpfen. Nur DisplayPort unterstützt die Übertragung 30 Bit Tiefe der Farbe.

* Es ist nicht sicher bekannt, ob Gaming-Grafikkarten die 30-Bit-Übertragung unterstützen, aber das Vorhandensein DisplayPort spricht über mögliche Unterstützung. In den Spezifikationen wird die Unterstützung nur für professionelle Grafikkarten angegeben AMD FirePro Und NVidia Quadro.

Es ist sehr gut, wenn man es hat . Man weiß nie, was nützlich sein könnte, und es ist besser, darauf vorbereitet zu sein. Plötzlich müssen Sie ein Signal vom Empfänger ausgeben. Übrigens, HDMI Und DVI kompatibel über einen einfachen Adapter und praktisch problemlos.

Schlussfolgerungen.

Das ist alles. Wir haben noch nicht einmal angefangen, wir sind bereits dabei, es zu Ende zu bringen. Da der Artikel die wichtigsten, allgemeinen Konzepte beschreibt, war er nicht zu lang.

Es werden jedoch alle wichtigen Punkte für die Auswahl einer hochwertigen und produktiven Grafikkarte beschrieben.

1. Eine Frage des Glaubens.

3. Anzahl der Ausführungseinheiten (TMU, ROP usw.).

4. Lautstärke, Frequenz und Bittiefe des Speicherbusses.

5. Finden Sie heraus, ob die Karte für den Energieverbrauch geeignet ist.

5. Kühlsystem.

6. Anschlüsse.

Wir hoffen, dass Sie mit diesem Wissen eine Grafikkarte entsprechend Ihren Anforderungen auswählen können.

Viel Glück bei Ihrer Wahl!