Jumlah unit komputasi (shader) atau prosesor. Kartu video, bagaimana memilih. FAQ tentang karakteristik saat memilih kartu video. Teknologi, fitur pabrikan dan arsitektur, sistem pendingin Jumlah prosesor shader

Di forum kami, lusinan orang setiap hari meminta saran untuk memodernisasi milik mereka sendiri, di mana kami dengan senang hati membantu mereka. Setiap hari, "mengevaluasi perakitan" dan memeriksa komponen yang dipilih oleh pelanggan kami untuk kompatibilitas, kami mulai memperhatikan bahwa pengguna memperhatikan terutama pada komponen lain yang tidak diragukan lagi penting. Dan jarang ada yang ingat bahwa saat memutakhirkan komputer, perlu memperbarui detail yang sama pentingnya -. Dan hari ini kami akan memberi tahu dan menunjukkan mengapa ini tidak boleh dilupakan.

“... Saya ingin memutakhirkan komputer saya agar semuanya terbang, saya membeli prosesor i7-3970X dan ibu ASRock X79 Extreme6, ditambah kartu video RADEON HD 7990 6GB. Apa lagi nan????777"
- begitulah kira-kira setengah dari semua pesan yang terkait dengan pembaruan komputer desktop dimulai. Berdasarkan anggaran mereka sendiri atau keluarga, pengguna mencoba memilih modul memori yang paling, paling gesit, dan indah. Pada saat yang sama, secara naif percaya bahwa 450W lama mereka akan menangani kartu video yang rakus dan prosesor "panas" selama overclocking pada saat yang bersamaan.

Kami, untuk bagian kami, telah menulis lebih dari sekali tentang pentingnya catu daya - tetapi, kami akui, itu mungkin tidak cukup jelas. Oleh karena itu, hari ini kami mengoreksi diri kami sendiri dan menyiapkan memo untuk Anda tentang apa yang akan terjadi jika Anda melupakannya saat Anda memutakhirkan PC - dengan gambar dan deskripsi terperinci.

Jadi kami memutuskan untuk memperbarui konfigurasi...


Untuk percobaan kami, kami memutuskan untuk mengambil komputer rata-rata baru dan memutakhirkannya ke level "mesin game". Anda tidak perlu banyak mengubah konfigurasi - cukup mengubah memori dan kartu video sehingga kami memiliki kesempatan untuk memainkan game yang kurang lebih modern dengan pengaturan detail yang layak. Konfigurasi awal komputer kita adalah sebagai berikut:

Sumber Daya listrik: ATX 12V 400W

Jelas bahwa untuk game, konfigurasi seperti itu, secara halus, agak lemah. Jadi sudah waktunya untuk perubahan! Kami akan mulai dengan hal yang sama dengan kebanyakan orang yang menginginkan "peningkatan" mulai dengan - dengan. Kami tidak akan mengganti motherboard - selama itu cocok untuk kami.

Karena kami memutuskan untuk tidak menyentuh motherboard, kami akan memilih satu yang kompatibel dengan soket FM2 (untungnya, ada tombol khusus untuk ini di situs web NIX di halaman deskripsi motherboard). Jangan serakah - ambil prosesor yang terjangkau, tetapi cepat dan bertenaga dengan frekuensi 4,1 GHz (hingga 4,4 GHz dalam mode Turbo CORE) dan pengganda tidak terkunci - kami juga suka melakukan overclock, tidak ada manusia yang asing bagi kami. Berikut spesifikasi prosesor yang kami pilih:

Karakteristik
frekuensi bus CPU 5000 MHz Disipasi daya 100 W Frekuensi prosesor 4,1 GHz atau hingga 4,4 GHz dalam mode Turbo CORE Inti Tanah kaya tembolok L1 96KB x2 tembolok L2 2048 KB x2, berjalan pada frekuensi prosesor dukungan 64 bit Ya Jumlah Core 4 Perkalian 41, pengganda tidak terkunci Inti video prosesor AMD Radeon HD 8670D pada 844 MHz; Shader Model 5 mendukung Jumlah maksimum RAM 64 GB Maks. jumlah monitor yang terhubung 3 terhubung langsung atau hingga 4 monitor menggunakan splitter DisplayPort

Satu batang untuk 4GB bukanlah pilihan kami. Pertama, kami menginginkan 16GB, dan kedua, kami perlu mengaktifkan operasi dua saluran, di mana kami akan memasang dua modul memori masing-masing 8GB di komputer kami. Throughput tinggi, tanpa heatsink, dan harga yang layak menjadikan ini pilihan paling lezat bagi kami. Selain itu, dari situs web AMD Anda dapat mengunduh program Radeon RAMDisk, yang memungkinkan kami membuat drive virtual super cepat hingga 6GB secara gratis - dan semua orang menyukai hal-hal berguna yang gratis.


Karakteristik
Penyimpanan 8 GB
Jumlah modul 2
Standar memori PC3-10600 (DDR3 1333MHz)
Frekuensi operasi hingga 1333 MHz
Pengaturan waktu 9-9-9-24
Tegangan suplai 1,5 V
Bandwidth 10667Mbps

Anda dapat dengan nyaman memutar video bawaan hanya di Minesweeper. Oleh karena itu, untuk memutakhirkan komputer ke level game, kami memilih yang modern dan bertenaga, tetapi bukan yang termahal.


Itu menjadi dengan memori video 2GB, dukungan untuk DirectX 11 dan OpenGL 4.x. dan sistem pendingin Twin Frozr IV yang luar biasa. Performanya seharusnya lebih dari cukup bagi kita untuk menikmati edisi terbaru dari franchise game terpopuler seperti Tomb Raider, Crysis, Hitman, dan Jauh Menangis. Karakteristik pilihan kami adalah sebagai berikut:


Karakteristik
GPU Geforce GTX 770
Frekuensi GPU 1098 MHz atau hingga 1150 MHz dengan GPU Boost
Jumlah prosesor shader 1536
memori video 2 GB
Jenis memori video GDDR5
Lebar bus memori video 256 bit
Frekuensi memori video 1753 MHz (QDR 7,010 GHz)
Jumlah pipa piksel 128, 32 unit sampling tekstur
Antarmuka PCI Express 3.0 16x (kompatibel dengan PCI Express 2.x/1.x) dengan kemampuan menggabungkan kartu menggunakan SLI.
Pelabuhan DisplayPort, DVI-D, DVI-I, HDMI, adaptor D-Sub disertakan
Pendinginan kartu video Aktif (heatsink + 2 kipas Twin Frozr IV di sisi depan papan)
Konektor daya 8pin+8pin
dukungan API DirectX 11 dan OpenGL 4.x
Panjang kartu video (diukur dalam NYX) 263 mm
Dukungan komputasi tujuan umum pada GPU DirectCompute 11, NVIDIA PhysX, CUDA, CUDA C++, OpenCL 1.0
Konsumsi Daya Maksimal FurMark+WinRar 255 W
peringkat kinerja 61.5

Kesulitan yang tidak terduga

Sekarang kami memiliki semua yang kami butuhkan untuk memutakhirkan komputer kami. Kami akan memasang komponen baru di kasing kami yang ada.


Kami meluncurkan - dan tidak berhasil. Dan mengapa? Tetapi karena catu daya anggaran secara fisik tidak mampu memulai komputer dengan sedikit pun. Faktanya adalah bahwa dalam kasus kami, dua konektor 8-pin diperlukan untuk catu daya, dan catu daya hanya memiliki satu konektor daya kartu video 6-pin "di pangkalan". Mempertimbangkan bahwa lebih banyak lagi yang membutuhkan lebih banyak konektor daripada dalam kasus kami, menjadi jelas bahwa catu daya perlu diubah.

Tapi itu masih setengah dari masalah. Bayangkan saja, tidak ada konektor daya! Di lab pengujian kami, ada adaptor yang cukup langka dari 6-pin ke 8-pin dan dari molex ke 6-pin. Seperti ini:


Perlu dicatat bahwa bahkan dengan anggaran catu daya modern, dengan setiap rilis baru konektor Molex, jumlahnya semakin berkurang - jadi kami dapat mengatakan bahwa kami beruntung.

Sekilas, semuanya baik-baik saja, dan dengan beberapa trik kami dapat memperbarui Unit sistem ke konfigurasi "permainan". Sekarang mari simulasikan beban dengan menjalankan uji Furmark dan pengarsipan 7Zip dalam mode Xtreme Burning di komputer game baru kita secara bersamaan. Kita bisa menyalakan komputer - sudah bagus. Sistem ini juga bertahan dari peluncuran Furmark. Kami meluncurkan pengarsipan - dan apa itu ?! Komputer dimatikan, setelah sebelumnya menyenangkan kami dengan deru kipas yang dilepaskan secara maksimal. 400W biasa yang "cepat" gagal, tidak peduli seberapa keras dia mencoba, untuk memberi makan kartu video dan prosesor yang kuat. Dan karena sistem pendingin yang biasa-biasa saja, sistem kami menjadi sangat panas, dan bahkan kecepatan kipas maksimum tidak memungkinkannya menghasilkan setidaknya 400W yang dinyatakan.

Ada jalan keluar!

Berlayar. Kami membeli komponen mahal untuk merakit komputer game, tetapi ternyata Anda tidak bisa memainkannya. Memalukan. Kesimpulannya jelas bagi semua orang: yang lama tidak cocok untuk kita komputer game dan perlu diganti dengan yang baru. Tapi yang mana tepatnya?

Untuk komputer kami yang dipompa, kami memilih berdasarkan empat kriteria utama:

Yang pertama, tentu saja, kekuatan. Kami lebih suka memilih dengan margin - kami juga ingin melakukan overclock prosesor dan mencetak poin dalam pengujian sintetik. Mempertimbangkan semua yang mungkin kami butuhkan di masa mendatang, kami memutuskan untuk memilih daya minimal 800W.

Kriteria kedua adalah reliabilitas.. Kami benar-benar ingin yang diambil "dengan margin" bertahan dari kartu video dan prosesor generasi berikutnya, tidak terbakar dengan sendirinya dan pada saat yang sama tidak membakar komponen mahal (bersama dengan situs pengujian). Oleh karena itu, pilihan kami hanyalah kapasitor Jepang, hanya perlindungan hubung singkat dan perlindungan kelebihan beban yang andal dari keluaran mana pun.

Poin ketiga dari persyaratan kami adalah kenyamanan dan fungsionalitas.. Pertama-tama, kita perlu - komputer akan sering bekerja, dan terutama PSU yang berisik, ditambah dengan kartu video dan pendingin prosesor, akan membuat pengguna gila. Selain itu, kami tidak asing dengan rasa keindahan, jadi catu daya baru untuk komputer game kami harus modular dan memiliki kabel dan konektor yang dapat dilepas. Sehingga tidak ada yang berlebihan.

Dan yang tak kalah pentingnya, kriterianya adalah efisiensi energi. Ya, kami peduli dengan lingkungan dan tagihan listrik. Oleh karena itu, catu daya yang kami pilih harus memenuhi setidaknya standar efisiensi energi 80+ Bronze.

Membandingkan dan menganalisis semua persyaratan, kami memilih di antara sedikit pelamar yang paling memenuhi semua persyaratan kami. Mereka menjadi kekuatan 850W. Perhatikan bahwa dalam sejumlah parameter bahkan melebihi persyaratan kami. Mari kita lihat spesifikasinya:

Spesifikasi catu daya
Jenis peralatan Catu daya dengan modul PFC (Koreksi Faktor Daya) aktif.
Properti Jalinan loop, kapasitor Jepang, Proteksi hubung singkat (SCP), Proteksi tegangan berlebih (OVP), Proteksi beban berlebih untuk output unit mana pun secara individual (OCP)
+3.3V - 24A, +5V - 24A, +12V - 70A, +5VSB - 3.0A, -12V - 0.5A
Kabel daya yang dapat dilepas Ya
efisiensi 90%, 80 PLUS Bersertifikat Emas
Daya catu daya 850 W
Konektor daya motherboard 24+8+8 pin, 24+8+4 pin, 24+8 pin, 24+4 pin, 20+4 pin
Konektor daya kartu video Konektor 6x 6/8-pin (konektor 8-pin yang dapat dilepas - 2 pin dapat dilepas)
MTBF 100 ribu jam
Pendinginan catu daya 1 kipas: 140 x 140 mm (di dinding bawah). Sistem pendingin pasif di bawah beban hingga 50%.
Kontrol kecepatan kipas Dari termostat. Mengubah kecepatan kipas tergantung pada suhu di dalam catu daya. Pemilihan mode pengoperasian kipas secara manual. Dalam mode Normal, kipas berputar terus-menerus, dan dalam mode Senyap, kipas berhenti sepenuhnya pada beban rendah.


, salah satu yang terbaik untuk uang. Mari kita instal dalam kasus kita:


Sesuatu terjadi di sini yang sedikit membingungkan kami. Tampaknya semuanya sudah terpasang dengan benar, semuanya terhubung, semuanya berfungsi - dan catu daya tidak bersuara! Artinya, secara umum: kipas, saat diam, tetap berdiri, dan sistem telah hidup dan berfungsi dengan baik. Faktanya adalah bahwa pada beban hingga 50%, catu daya beroperasi dalam apa yang disebut mode senyap - tanpa memutar kipas sistem pendingin. Kipas hanya berdengung di bawah beban berat - peluncuran pengarsipan dan Furmark secara bersamaan masih membuat putaran lebih dingin.


Catu daya memiliki sebanyak enam konektor daya kartu video 8-pin6-pin, yang masing-masing merupakan konektor 8-pin yang dapat dilipat, dari mana, jika perlu, 2 pin dapat dibuka. Dengan demikian, ia dapat memberi makan kartu video apa pun tanpa kerumitan dan kesulitan yang tidak perlu. Dan bahkan tidak satu pun.


Sistem catu daya modular memungkinkan Anda melepaskan kabel daya yang tidak perlu dan tidak perlu, yang meningkatkan ventilasi casing, stabilitas sistem, dan, tentu saja, meningkatkan estetika. penampilan ruang interior, yang memungkinkan kami merekomendasikannya dengan aman kepada modder dan penggemar kasing dengan jendela.
beli catu daya yang andal dan kuat. Dalam ulasan kami, dia menjadi. - dan seperti yang Anda lihat, bukan secara kebetulan. Setelah membeli yang sama di NYKS, Anda dapat yakin bahwa semua komponen sistem berperforma tinggi Anda akan dilengkapi dengan cukup dan catu daya tanpa gangguan, bahkan di bawah overclocking ekstrim.


Selain itu, catu daya akan bertahan selama beberapa tahun ke depan - lebih baik dengan margin, jika Anda akan meningkatkan sistem dengan komponen tingkat tinggi di masa mendatang.

Komponen dasar kartu video:

  • keluar;
  • antarmuka;
  • sistem pendingin;
  • prosesor grafis;
  • memori video.

teknologi grafis:

  • kamus;
  • Arsitektur GPU: fitur
    unit simpul/piksel, shader, laju pengisian, unit tekstur/raster, saluran pipa;
  • Arsitektur GPU: teknologi
    proses pembuatan, frekuensi GPU, memori video lokal (ukuran, bus, tipe, frekuensi), solusi dengan beberapa kartu video;
  • fitur visual
    DirectX, rentang dinamis tinggi (HDR), FSAA, pemfilteran tekstur, tekstur resolusi tinggi.

Glosarium istilah grafis dasar

Tingkat Penyegaran

Seperti di bioskop atau di TV, komputer Anda mensimulasikan gerakan di monitor dengan menampilkan urutan bingkai. Kecepatan penyegaran monitor menunjukkan berapa kali per detik gambar akan diperbarui di layar. Misalnya, 75 Hz sama dengan 75 pembaruan per detik.

Jika komputer memproses bingkai lebih cepat daripada yang dapat dihasilkan monitor, maka game mungkin mengalami masalah. Misalnya, jika komputer menghitung 100 frame per detik, dan kecepatan refresh monitor adalah 75 Hz, maka karena overlay, monitor hanya dapat menampilkan sebagian gambar selama periode refreshnya. Akibatnya, artefak visual muncul.

Sebagai solusinya, Anda bisa mengaktifkan V-Sync (vertical sync). Ini membatasi jumlah bingkai yang dapat dihasilkan komputer ke kecepatan penyegaran monitor, mencegah artefak. Jika Anda mengaktifkan V-Sync, jumlah bingkai yang dirender dalam game tidak akan melebihi kecepatan penyegaran. Artinya, pada 75 Hz, komputer akan menampilkan tidak lebih dari 75 frame per detik.

Piksel

Kata "Pixel" adalah singkatan dari " foto mendatang el ement" adalah elemen gambar. Ini adalah titik kecil pada layar yang dapat menyala dalam warna tertentu (umumnya, rona ditampilkan dengan kombinasi tiga warna dasar: merah, hijau, dan biru). Jika resolusi layar 1024×768, maka Anda dapat melihat matriks dengan lebar 1024 piksel dan tinggi 768 piksel. Bersama-sama, piksel membentuk gambar. Gambar di layar diperbarui dari 60 hingga 120 kali per detik, tergantung pada jenis tampilan dan data yang disediakan oleh keluaran kartu video. Monitor CRT memperbarui tampilan baris demi baris, sedangkan monitor panel datar LCD dapat memperbarui setiap piksel satu per satu.

Puncak

Semua objek dalam adegan 3D terdiri dari simpul. Simpul adalah titik dalam ruang 3D dengan koordinat x, y, dan z. Beberapa simpul dapat dikelompokkan menjadi poligon: paling sering segitiga, tetapi bentuk yang lebih kompleks dimungkinkan. Poligon tersebut kemudian diberi tekstur untuk membuat objek terlihat realistis. Kubus 3D yang ditunjukkan pada ilustrasi di atas memiliki delapan simpul. Objek yang lebih kompleks memiliki permukaan melengkung yang sebenarnya terdiri dari sejumlah besar simpul.

Tekstur

Tekstur hanyalah gambar 2D dengan ukuran sembarang yang dihamparkan pada objek 3D untuk mensimulasikan permukaannya. Misalnya, kubus 3D kita memiliki delapan simpul. Sebelum pemetaan tekstur sepertinya kotak sederhana. Namun saat kita menerapkan tekstur, kotak menjadi berwarna.

Shader

Perangkat lunak pixel shader memungkinkan kartu grafis menghasilkan efek yang mengesankan, seperti air masuk ini Gulungan Penatua: terlupakan.

Saat ini ada dua jenis shader: vertex dan piksel. Vertex shader dapat memodifikasi atau mengubah objek 3D. Program shader piksel memungkinkan Anda mengubah warna piksel berdasarkan beberapa data. Bayangkan sebuah sumber cahaya dalam adegan 3D yang membuat objek yang disinari bersinar lebih terang, dan pada saat yang sama, membuat bayangan pada objek lain. Semua ini diimplementasikan dengan mengubah informasi warna piksel.

Pixel shader digunakan untuk membuat efek kompleks di game favorit Anda. Misalnya, kode shader dapat membuat piksel yang mengelilingi pedang 3D bersinar lebih terang. Shader lain dapat memproses semua simpul objek 3D yang kompleks dan mensimulasikan ledakan. Pengembang game semakin beralih ke program shader yang kompleks untuk membuat grafik yang realistis. Hampir setiap game kaya grafis modern menggunakan shader.

Dengan dirilisnya antarmuka pemrograman aplikasi berikutnya (API, Application Programming Interface) Microsoft DirectX 10, jenis shader ketiga yang disebut shader geometri akan dirilis. Dengan bantuan mereka, dimungkinkan untuk memecahkan objek, memodifikasi, dan bahkan menghancurkannya, tergantung pada hasil yang diinginkan. Jenis shader ketiga dapat diprogram dengan cara yang persis sama seperti dua yang pertama, tetapi perannya akan berbeda.

Tingkat Pengisian

Sangat sering pada kotak kartu video Anda dapat menemukan nilai rasio pengisian. Pada dasarnya, fillrate menunjukkan seberapa cepat GPU dapat merender piksel. Kartu video lama memiliki rasio pengisian segitiga. Namun saat ini ada dua jenis rasio pengisian: rasio pengisian piksel dan rasio pengisian tekstur. Seperti yang telah disebutkan, tingkat pengisian piksel sesuai dengan tingkat keluaran piksel. Ini dihitung sebagai jumlah operasi raster (ROP) dikalikan dengan frekuensi clock.

ATi dan nVidia menghitung tingkat pengisian tekstur secara berbeda. Menurut Nvidia, kecepatan diperoleh dengan mengalikan jumlah pipa piksel dengan kecepatan jam. Dan ATi mengalikan jumlah unit tekstur dengan kecepatan jam. Pada prinsipnya, kedua metode tersebut benar, karena nVidia menggunakan satu unit tekstur per unit shader piksel (yaitu, satu pipa per piksel).

Dengan mengingat definisi ini, mari kita lanjutkan dan diskusikan fitur GPU yang paling penting, apa fungsinya, dan mengapa fitur ini begitu penting.

Arsitektur GPU: fitur

Realisme grafik 3D sangat bergantung pada kinerja kartu grafis. Semakin banyak blok shader piksel yang dikandung prosesor dan semakin tinggi frekuensinya, semakin banyak efek yang dapat diterapkan pada pemandangan 3D untuk meningkatkan persepsi visualnya.

GPU berisi banyak blok fungsional yang berbeda. Dari jumlah beberapa komponen, Anda dapat memperkirakan seberapa kuat GPU tersebut. Sebelum melanjutkan, mari kita lihat blok fungsional yang paling penting.

Prosesor Vertex (Unit Vertex Shader)

Seperti pixel shader, prosesor vertex mengeksekusi kode shader yang menyentuh simpul. Karena anggaran vertex yang lebih besar memungkinkan Anda membuat objek 3D yang lebih kompleks, kinerja prosesor vertex sangat penting dalam adegan 3D dengan objek yang kompleks atau berjumlah besar. Namun, unit shader vertex masih tidak memiliki dampak yang jelas pada kinerja seperti prosesor piksel.

Prosesor piksel (pixel shader)

Prosesor piksel adalah komponen chip grafis yang didedikasikan untuk memproses program shader piksel. Prosesor ini melakukan perhitungan yang berkaitan dengan piksel saja. Karena piksel berisi informasi warna, pixel shader dapat menghasilkan efek grafis yang mengesankan. Misalnya, sebagian besar efek air yang Anda lihat di game dibuat menggunakan pixel shader. Biasanya, jumlah prosesor piksel digunakan untuk membandingkan kinerja piksel kartu video. Jika satu kartu dilengkapi dengan delapan unit shader piksel dan yang lainnya dengan 16 unit, maka cukup logis untuk mengasumsikan bahwa kartu video dengan 16 unit akan memproses program piksel kompleks lebih cepat. Kecepatan jam juga harus dipertimbangkan, tetapi saat ini menggandakan jumlah prosesor piksel lebih efisien dalam hal konsumsi daya daripada menggandakan frekuensi chip grafis.

Shader terpadu

Shader terpadu (tunggal) belum hadir di dunia PC, tetapi standar DirectX 10 yang akan datang bergantung pada arsitektur serupa. Artinya, struktur kode program vertex, geometris, dan piksel akan sama, meskipun shader akan melakukan pekerjaan yang berbeda. Spesifikasi baru dapat dilihat di Xbox 360, di mana GPU dirancang khusus oleh ATi untuk Microsoft. Akan sangat menarik untuk melihat potensi apa yang dibawa oleh DirectX 10 yang baru.

Unit Pemetaan Tekstur (TMU)

Tekstur harus dipilih dan disaring. Pekerjaan ini dilakukan oleh unit pemetaan tekstur, yang bekerja bersama dengan unit pixel dan shader vertex. Tugas TMU adalah menerapkan operasi tekstur pada piksel. Jumlah unit tekstur dalam GPU sering digunakan untuk membandingkan kinerja tekstur kartu grafis. Cukup masuk akal untuk berasumsi bahwa kartu video dengan lebih banyak TMU akan memberikan performa tekstur yang lebih baik.

Unit Operator Raster (ROP)

RIP bertanggung jawab untuk menulis data piksel ke memori. Tingkat di mana operasi ini dilakukan adalah tingkat pengisian. Pada hari-hari awal akselerator 3D, jumlah ROP dan rasio pengisian sangat tinggi karakteristik penting kartu video. Saat ini, pekerjaan ROP masih penting, tetapi kinerja kartu video tidak lagi dibatasi oleh blok-blok ini seperti dulu. Oleh karena itu, kinerja (dan jumlah) ROP jarang digunakan untuk menilai kecepatan kartu video.

Konveyor

Pipeline digunakan untuk menggambarkan arsitektur kartu video dan memberikan representasi yang sangat visual dari kinerja GPU.

Konveyor tidak dapat dianggap sebagai istilah teknis yang ketat. GPU menggunakan jalur pipa berbeda yang menjalankan fungsi berbeda. Secara historis, pipa dipahami sebagai prosesor piksel yang terhubung ke unit pemetaan tekstur (TMU) miliknya sendiri. Misalnya, kartu video Radeon 9700 menggunakan delapan prosesor piksel, yang masing-masing terhubung ke TMU-nya sendiri, sehingga kartu tersebut dianggap memiliki delapan jalur pipa.

Tetapi sangat sulit untuk mendeskripsikan prosesor modern dengan jumlah saluran pipa. Dibandingkan dengan desain sebelumnya, prosesor baru ini menggunakan struktur modular dan terfragmentasi. ATi dapat dianggap sebagai inovator di bidang ini, yang, dengan lini kartu video X1000, beralih ke struktur modular, yang memungkinkan pencapaian peningkatan kinerja melalui pengoptimalan internal. Beberapa blok CPU digunakan lebih dari yang lain, dan untuk meningkatkan kinerja GPU, ATi telah mencoba menemukan kompromi antara jumlah blok yang dibutuhkan dan area mati (tidak dapat ditingkatkan terlalu banyak). Dalam arsitektur ini, istilah "pipa piksel" telah kehilangan artinya, karena prosesor piksel tidak lagi terhubung ke TMU mereka sendiri. Misalnya, GPU ATi Radeon X1600 memiliki 12 pixel shader dan total empat TMU. Oleh karena itu, tidak dapat dikatakan bahwa arsitektur prosesor ini memiliki 12 pipa piksel, sama seperti tidak dapat dikatakan bahwa hanya ada empat. Namun, menurut tradisi, pipa piksel masih disebutkan.

Dengan mempertimbangkan asumsi ini, jumlah pipeline piksel dalam GPU sering digunakan untuk membandingkan kartu video (dengan pengecualian lini ATi X1x00). Misalnya, jika kita mengambil kartu video dengan 24 dan 16 pipa, maka cukup masuk akal untuk mengasumsikan bahwa kartu dengan 24 pipa akan lebih cepat.

Arsitektur GPU: Teknologi

Proses teknologi

Istilah ini mengacu pada ukuran satu elemen (transistor) dari chip dan keakuratan proses pembuatannya. Peningkatan proses teknis memungkinkan untuk mendapatkan elemen dengan dimensi yang lebih kecil. Misalnya, proses 0,18 µm menghasilkan fitur yang lebih besar daripada proses 0,13 µm, sehingga tidak seefisien itu. Transistor yang lebih kecil beroperasi pada tegangan yang lebih rendah. Pada gilirannya, penurunan voltase menyebabkan penurunan resistansi termal, yang mengurangi jumlah panas yang dihasilkan. Meningkatkan teknologi proses memungkinkan Anda mengurangi jarak antara blok fungsional chip, dan membutuhkan lebih sedikit waktu untuk mentransfer data. Jarak yang lebih pendek, voltase yang lebih rendah, dan peningkatan lainnya memungkinkan kecepatan clock yang lebih tinggi tercapai.

Agak memperumit pemahaman bahwa mikrometer (µm) dan nanometer (nm) digunakan saat ini untuk menunjuk teknologi proses. Faktanya, semuanya sangat sederhana: 1 nanometer sama dengan 0,001 mikrometer, jadi proses pembuatan 0,09 mikron dan 90 nm adalah hal yang sama. Seperti disebutkan di atas, teknologi proses yang lebih kecil memungkinkan Anda mendapatkan kecepatan clock yang lebih tinggi. Misalnya, jika kita membandingkan kartu video dengan chip 0,18 mikron dan 0,09 mikron (90 nm), maka cukup masuk akal untuk mengharapkan frekuensi yang lebih tinggi dari kartu 90 nm.

Kecepatan jam GPU

Kecepatan clock GPU diukur dalam megahertz (MHz), yaitu jutaan siklus per detik.

Kecepatan jam secara langsung memengaruhi kinerja GPU. Semakin tinggi, semakin banyak pekerjaan yang dapat dilakukan per detik. Sebagai contoh pertama, mari kita ambil kartu video nVidia GeForce 6600 dan 6600 GT: prosesor grafis 6600 GT berjalan pada 500 MHz, sedangkan kartu 6600 biasa berjalan pada 400 MHz. Karena prosesornya identik secara teknis, peningkatan kecepatan clock sebesar 20% pada 6600 GT menghasilkan kinerja yang lebih baik.

Tapi kecepatan jam bukanlah segalanya. Perlu diingat bahwa kinerja sangat dipengaruhi oleh arsitektur. Untuk contoh kedua, ambil kartu video GeForce 6600 GT dan GeForce 6800 GT. Frekuensi GPU 6600 GT adalah 500 MHz, tetapi 6800 GT hanya berjalan pada 350 MHz. Sekarang mari kita pertimbangkan bahwa 6800 GT menggunakan pipa 16 piksel, sedangkan 6600 GT hanya memiliki delapan. Oleh karena itu, 6800 GT dengan 16 pipeline pada 350 MHz akan memberikan kinerja yang hampir sama dengan prosesor dengan delapan pipeline dan kecepatan clock dua kali lipat (700 MHz). Dengan demikian, kecepatan jam dapat digunakan untuk membandingkan kinerja.

Memori video lokal

Memori kartu grafis berdampak besar pada kinerja. Tetapi pengaturan memori yang berbeda mempengaruhi secara berbeda.

Memori video

Jumlah memori video mungkin bisa disebut sebagai parameter kartu video, yang paling ditaksir terlalu tinggi. Konsumen yang tidak berpengalaman sering menggunakan jumlah memori video untuk membandingkan kartu yang berbeda satu sama lain, tetapi kenyataannya, jumlah tersebut memiliki pengaruh yang kecil terhadap kinerja dibandingkan dengan parameter seperti frekuensi bus memori dan antarmuka (lebar bus).

Dalam kebanyakan kasus, kartu dengan memori video 128 MB akan bekerja hampir sama dengan kartu dengan 256 MB. Tentu saja, ada situasi di mana lebih banyak memori menghasilkan kinerja yang lebih baik, tetapi perlu diingat bahwa lebih banyak memori tidak akan secara otomatis meningkatkan kecepatan game.

Di mana volume berguna dalam game dengan tekstur resolusi tinggi. Pengembang game menyertakan beberapa set tekstur dengan game tersebut. Dan semakin banyak memori yang ada pada kartu video, semakin tinggi resolusi tekstur yang dimuat. Tekstur resolusi tinggi memberikan definisi dan detail yang lebih tinggi dalam game. Oleh karena itu, cukup masuk akal untuk mengambil kartu dengan memori yang besar, jika semua kriteria lainnya sama. Ingatlah sekali lagi bahwa lebar bus memori dan frekuensinya memiliki pengaruh yang jauh lebih kuat pada kinerja daripada jumlah memori fisik pada kartu.

Lebar bus memori

Lebar bus memori adalah salah satu aspek terpenting dari performa memori. Lebar bus modern berkisar dari 64 hingga 256 bit, dan dalam beberapa kasus bahkan 512 bit. Semakin lebar bus memori, semakin banyak informasi yang dapat ditransfer per jam. Dan ini secara langsung mempengaruhi kinerja. Misalnya, jika kita menggunakan dua bus dengan frekuensi yang sama, maka secara teoritis bus 128-bit akan mentransfer data dua kali lebih banyak per jam daripada bus 64-bit. Bus 256-bit dua kali lebih besar.

Bandwidth bus yang lebih tinggi (dinyatakan dalam bit atau byte per detik, 1 byte = 8 bit) memberikan kinerja memori yang lebih baik. Itu sebabnya bus memori jauh lebih penting daripada ukurannya. Pada frekuensi yang sama, bus memori 64-bit hanya beroperasi pada 25% dari bus 256-bit!

Mari kita ambil contoh berikut. Kartu video dengan memori video 128 MB tetapi dengan bus 256-bit memberikan kinerja memori yang jauh lebih baik daripada model 512 MB dengan bus 64-bit. Penting untuk dicatat bahwa untuk beberapa kartu dari seri ATi X1x00, pabrikan menentukan spesifikasi bus memori internal, tetapi kami tertarik pada parameter bus eksternal. Misalnya, ring bus internal X1600 memiliki lebar 256 bit, tetapi ring bus eksternal hanya memiliki lebar 128 bit. Dan kenyataannya, bus memori bekerja dengan performa 128-bit.

Jenis memori

Memori dapat dibagi menjadi dua kategori utama: SDR (transfer data tunggal) dan DDR (transfer data ganda), di mana data ditransfer per jam dua kali lebih cepat. Saat ini, teknologi transmisi tunggal SDR sudah usang. Karena memori DDR mentransfer data dua kali lebih cepat dari SDR, penting untuk diingat bahwa kartu video dengan memori DDR sering menunjukkan frekuensi dua kali lipat, bukan frekuensi fisik. Misalnya, jika memori DDR terdaftar pada 1000 MHz, itu adalah frekuensi efektif yang harus dijalankan oleh memori SDR biasa untuk memberikan bandwidth yang sama. Namun nyatanya, frekuensi fisiknya adalah 500 MHz.

Oleh karena itu, banyak orang yang terkejut ketika memori kartu video mereka terdaftar pada DDR 1200 MHz, sedangkan utilitas melaporkan 600 MHz. Jadi, Anda harus membiasakan diri. Memori DDR2 dan GDDR3/GDDR4 bekerja dengan prinsip yang sama, yaitu dengan transfer data ganda. Perbedaan antara memori DDR, DDR2, GDDR3 dan GDDR4 terletak pada teknologi produksi dan beberapa detailnya. DDR2 dapat beroperasi pada frekuensi yang lebih tinggi dari memori DDR, dan DDR3 - bahkan lebih tinggi dari DDR2.

Frekuensi bus memori

Seperti prosesor, memori (atau, lebih tepatnya, bus memori) berjalan pada kecepatan jam tertentu, diukur dalam megahertz. Di sini, peningkatan kecepatan jam secara langsung memengaruhi kinerja memori. Dan frekuensi bus memori adalah salah satu parameter yang digunakan untuk membandingkan kinerja kartu video. Misalnya, jika semua karakteristik lain (lebar bus memori, dll.) Sama, cukup logis untuk mengatakan bahwa kartu video dengan memori 700 MHz lebih cepat daripada kartu video 500 MHz.

Sekali lagi, kecepatan jam bukanlah segalanya. Memori 700 MHz dengan bus 64-bit akan lebih lambat dari memori 400 MHz dengan bus 128-bit. Performa memori 400 MHz pada bus 128-bit sama dengan memori 800 MHz pada bus 64-bit. Anda juga harus ingat bahwa frekuensi GPU dan memori adalah parameter yang sama sekali berbeda, dan biasanya berbeda.

Antarmuka kartu video

Semua data yang ditransfer antara kartu video dan prosesor melewati antarmuka kartu video. Saat ini, tiga jenis antarmuka digunakan untuk kartu video: PCI, AGP, dan PCI Express. Mereka berbeda dalam bandwidth dan karakteristik lainnya. Jelas bahwa semakin tinggi bandwidth, semakin tinggi nilai tukarnya. Namun, hanya kartu paling modern yang dapat menggunakan bandwidth tinggi, itupun hanya sebagian. Pada titik tertentu, kecepatan antarmuka tidak lagi menjadi "hambatan", itu sudah cukup hari ini.

Bus paling lambat yang memproduksi kartu video adalah PCI (Peripheral Components Interconnect). Tanpa masuk ke sejarah, tentu saja. PCI benar-benar memperburuk kinerja kartu video, jadi mereka beralih ke antarmuka AGP (Accelerated Graphics Port). Tetapi bahkan spesifikasi AGP 1.0 dan 2x membatasi kinerja. Saat standar meningkatkan kecepatan ke AGP 4x, kami mulai mendekati batas praktis bandwidth yang dapat digunakan kartu video. Spesifikasi AGP 8x sekali lagi menggandakan bandwidth dibandingkan dengan AGP 4x (2,16 GB / s), tetapi kami tidak mendapatkan peningkatan kinerja grafis yang nyata.

Bus terbaru dan tercepat adalah PCI Express. Kartu grafis yang lebih baru biasanya menggunakan antarmuka PCI Express x16, yang menggabungkan 16 jalur PCI Express untuk bandwidth total 4 GB/dtk (dalam satu arah). Ini adalah dua kali throughput AGP 8x. Bus PCI Express memberikan bandwidth yang disebutkan untuk kedua arah (transfer data ke dan dari kartu video). Tetapi kecepatan standar AGP 8x sudah cukup, jadi kami belum melihat situasi di mana beralih ke PCI Express memberikan peningkatan kinerja dibandingkan dengan AGP 8x (jika parameter perangkat keras lainnya sama). Misalnya, versi AGP dari GeForce 6800 Ultra akan bekerja secara identik dengan 6800 Ultra untuk PCI Express.

Hari ini yang terbaik adalah membeli kartu dengan antarmuka PCI Express, itu akan bertahan di pasar selama beberapa tahun lagi. Kartu paling produktif tidak lagi diproduksi dengan antarmuka AGP 8x, dan solusi PCI Express, sebagai aturan, sudah lebih mudah ditemukan daripada analog AGP, dan harganya lebih murah.

Solusi Multi-GPU

Menggunakan beberapa kartu grafis untuk meningkatkan performa grafis bukanlah ide baru. Pada hari-hari awal grafis 3D, 3dfx memasuki pasar dengan dua kartu grafis berjalan secara paralel. Tetapi dengan hilangnya 3dfx, teknologi untuk bekerja sama dengan beberapa kartu video konsumen dilupakan, meskipun ATi telah memproduksi sistem serupa untuk simulator profesional sejak rilis Radeon 9700. Beberapa tahun yang lalu, teknologi tersebut kembali ke pasar dengan munculnya solusi nVidia SLI dan, beberapa saat kemudian, ATi Crossfire.

Berbagi beberapa kartu grafis memberikan performa yang cukup untuk menjalankan game pada pengaturan kualitas tinggi dalam definisi tinggi. Tetapi memilih satu atau yang lain tidaklah mudah.

Mari kita mulai dengan fakta bahwa solusi berdasarkan beberapa kartu video membutuhkan sejumlah besar energi, jadi catu daya harus cukup kuat. Semua panas ini harus dikeluarkan dari kartu video, jadi Anda perlu memperhatikan casing PC dan pendinginan agar sistem tidak terlalu panas.

Ingat juga bahwa SLI/CrossFire memerlukan motherboard yang sesuai (baik untuk satu teknologi atau lainnya), yang biasanya lebih mahal daripada model standar. Konfigurasi nVidia SLI hanya akan berfungsi pada kartu nForce4 tertentu, sedangkan kartu ATi CrossFire hanya akan berfungsi pada motherboard dengan chipset CrossFire atau pada beberapa model Intel. Lebih buruk lagi, beberapa konfigurasi CrossFire mengharuskan salah satu kartu menjadi khusus: Edisi CrossFire. Setelah rilis CrossFire, untuk beberapa model kartu video, ATi mengizinkan penyertaan teknologi kerja sama melalui bus PCI Express, dan dengan dirilisnya versi driver baru, jumlah kemungkinan kombinasi meningkat. Namun tetap saja perangkat keras CrossFire dengan kartu Edisi CrossFire yang sesuai memberikan kinerja yang lebih baik. Tetapi kartu Edisi CrossFire juga lebih mahal daripada model biasa. Saat ini, Anda dapat mengaktifkan mode perangkat lunak CrossFire (tanpa kartu CrossFire Edition) pada kartu grafis Radeon X1300, X1600 dan X1800 GTO.

Faktor-faktor lain juga harus diperhitungkan. Meskipun dua kartu grafis yang bekerja bersama memberikan peningkatan kinerja, itu jauh dari dua kali lipat. Tetapi Anda akan membayar uang dua kali lipat. Paling sering, peningkatan produktivitas adalah 20-60%. Dan dalam beberapa kasus, karena biaya komputasi tambahan untuk pencocokan, tidak ada peningkatan sama sekali. Karena alasan ini, konfigurasi multi-kartu tidak mungkin terbayar dengan model murah, karena kartu video yang lebih mahal biasanya selalu mengungguli sepasang kartu murah. Secara umum, bagi sebagian besar konsumen, mengambil solusi SLI / CrossFire tidak masuk akal. Tetapi jika Anda ingin mengaktifkan semua opsi peningkatan kualitas atau bermain pada resolusi ekstrem, misalnya 2560x1600, saat Anda perlu menghitung lebih dari 4 juta piksel per bingkai, maka dua atau empat kartu video berpasangan sangat diperlukan.

Fitur Visual

Selain spesifikasi perangkat keras murni, generasi dan model GPU yang berbeda dapat berbeda dalam set fitur. Misalnya, sering dikatakan bahwa kartu generasi ATi Radeon X800 XT kompatibel dengan Shader Model 2.0b (SM), sedangkan nVidia GeForce 6800 Ultra kompatibel dengan SM 3.0, meskipun spesifikasi perangkat kerasnya dekat satu sama lain (16 pipeline) . Oleh karena itu, banyak konsumen membuat pilihan untuk satu solusi atau lainnya, bahkan tanpa mengetahui apa arti perbedaan ini.

Versi Model Microsoft DirectX dan Shader

Nama-nama ini paling sering digunakan dalam perselisihan, tetapi hanya sedikit orang yang tahu apa artinya sebenarnya. Untuk memahaminya, mari kita mulai dengan sejarah API grafik. DirectX dan OpenGL adalah API grafik, yaitu Antarmuka Pemrograman Aplikasi - standar kode terbuka tersedia untuk semua orang.

Sebelum munculnya API grafis, setiap produsen GPU memiliki mekanisme komunikasinya sendiri dengan game. Pengembang harus menulis kode terpisah untuk setiap GPU yang ingin mereka dukung. Pendekatan yang sangat mahal dan tidak efisien. Untuk mengatasi masalah ini, API untuk grafik 3D dikembangkan sehingga pengembang akan menulis kode untuk API tertentu, dan bukan untuk kartu video ini atau itu. Setelah itu, masalah kompatibilitas jatuh ke pundak produsen kartu video, yang harus memastikan bahwa driver tersebut kompatibel dengan API.

Satu-satunya komplikasi yang tersisa saat ini adalah dua API berbeda yang digunakan, yaitu Microsoft DirectX dan OpenGL, di mana GL adalah singkatan dari Graphics Library (perpustakaan grafis). Karena API DirectX lebih populer di game saat ini, kami akan fokus padanya. Dan standar ini lebih kuat mempengaruhi perkembangan game.

DirectX adalah pembuatan Microsoft. Faktanya, DirectX menyertakan beberapa API, hanya satu yang digunakan untuk grafik 3D. DirectX menyertakan API untuk suara, musik, perangkat input, dan lainnya. Direct3D API bertanggung jawab atas grafik 3D di DirectX. Ketika mereka berbicara tentang kartu video, mereka benar-benar bermaksud demikian, oleh karena itu, dalam hal ini, konsep DirectX dan Direct3D dapat dipertukarkan.

DirectX diperbarui secara berkala seiring kemajuan teknologi grafis dan pengembang game memperkenalkan teknik pemrograman game baru. Karena popularitas DirectX berkembang pesat, pabrikan GPU mulai menyesuaikan rilis produk baru agar sesuai dengan kemampuan DirectX. Karena alasan ini, kartu video sering dikaitkan dengan dukungan perangkat keras dari satu atau beberapa generasi DirectX (DirectX 8, 9.0 atau 9.0c).

Untuk lebih memperumit masalah, bagian dari Direct3D API dapat berubah dari waktu ke waktu tanpa mengubah generasi DirectX. Misalnya, spesifikasi DirectX 9.0 menentukan dukungan untuk Pixel Shader 2.0. Tetapi pembaruan DirectX 9.0c menyertakan Pixel Shader 3.0. Jadi meskipun kartu berada di kelas DirectX 9, mereka mungkin mendukung set fitur yang berbeda. Misalnya, Radeon 9700 mendukung Shader Model 2.0 dan Radeon X1800 mendukung Shader Model 3.0, meskipun kedua kartu tersebut dapat diklasifikasikan sebagai generasi DirectX 9.

Ingatlah bahwa saat membuat game baru, pengembang memperhitungkan pemilik mesin dan kartu video lama, karena jika Anda mengabaikan segmen pengguna ini, penjualan akan lebih rendah. Untuk alasan ini, beberapa jalur kode dibangun ke dalam game. Gim kelas DirectX 9 kemungkinan besar akan memiliki jalur DirectX 8 dan bahkan jalur DirectX 7. Biasanya, jika jalur lama dipilih, beberapa efek virtual yang ada di kartu video baru akan hilang di dalam gim. Tapi setidaknya Anda bisa bermain bahkan di perangkat keras lama.

Banyak game baru memerlukan penginstalan DirectX versi terbaru, meskipun kartu grafisnya berasal dari generasi sebelumnya. Artinya, game baru yang akan menggunakan jalur DirectX 8 ini tetap membutuhkan DirectX 9 versi terbaru untuk dipasang di kartu grafis sekelas DirectX 8.

Apa perbedaan antara berbagai versi API Direct3D di DirectX? Versi awal DirectX—3, 5, 6, dan 7—relatif sederhana dalam kaitannya dengan Direct3D API. Pengembang dapat memilih efek visual dari daftar, dan kemudian memeriksa pekerjaan mereka di dalam game. Langkah besar berikutnya dalam pemrograman grafis adalah DirectX 8. Ini memperkenalkan kemampuan untuk memprogram kartu grafis menggunakan shader, sehingga untuk pertama kalinya pengembang memiliki kebebasan untuk memprogram efek sesuai keinginan mereka. DirectX 8 mendukung Pixel Shader versi 1.0 hingga 1.3 dan Vertex Shader 1.0. DirectX 8.1, versi terbaru dari DirectX 8, menerima Pixel Shader 1.4 dan Vertex Shader 1.1.

Di DirectX 9, Anda dapat membuat program shader yang lebih kompleks. DirectX 9 mendukung Pixel Shader 2.0 dan Vertex Shader 2.0. DirectX 9c, versi terbaru dari DirectX 9, menyertakan spesifikasi Pixel Shader 3.0.

DirectX 10, rilis API yang akan datang, akan menemani versi baru Windows Vista. DirectX 10 tidak dapat diinstal pada Windows XP.

Pencahayaan HDR dan OpenEXR HDR

HDR adalah singkatan dari "Rentang Dinamis Tinggi", rentang dinamis tinggi. Gim dengan pencahayaan HDR dapat memberikan gambar yang jauh lebih realistis daripada gim tanpanya, dan tidak semua kartu grafis mendukung pencahayaan HDR.

Sebelum munculnya kartu grafis kelas DirectX 9, GPU sangat dibatasi oleh keakuratan perhitungan pencahayaannya. Hingga saat ini, pencahayaan hanya dapat dihitung dengan level internal 256 (8 bit).

Saat kartu grafis kelas DirectX 9 keluar, mereka mampu menghasilkan pencahayaan dengan fidelitas tinggi - 24 bit penuh atau 16,7 juta level.

Dengan 16,7 juta level, dan setelah mengambil langkah selanjutnya dalam performa kartu grafis kelas DirectX 9/Shader Model 2.0, pencahayaan HDR juga dimungkinkan di komputer. Ini adalah teknologi yang agak rumit, dan Anda perlu menontonnya secara dinamis. Secara sederhana, pencahayaan HDR meningkatkan kontras (bayangan gelap tampak lebih gelap, bayangan terang lebih terang), sekaligus meningkatkan jumlah detail pencahayaan di area gelap dan terang. Gim dengan pencahayaan HDR terasa lebih hidup dan realistis dibandingkan tanpanya.

GPU yang sesuai dengan spesifikasi Pixel Shader 3.0 terbaru memungkinkan kalkulasi pencahayaan presisi 32-bit yang lebih tinggi serta pencampuran floating point. Dengan demikian, kartu grafis kelas SM 3.0 dapat mendukung metode pencahayaan HDR khusus OpenEXR, yang dirancang khusus untuk industri film.

Beberapa game yang hanya mendukung pencahayaan HDR menggunakan metode OpenEXR tidak akan berjalan dengan pencahayaan HDR pada kartu grafis Shader Model 2.0. Namun, game yang tidak mengandalkan metode OpenEXR akan berfungsi di semua kartu grafis DirectX 9. Misalnya, Oblivion menggunakan metode HDR OpenEXR dan hanya memungkinkan pencahayaan HDR diaktifkan pada kartu grafis terbaru yang mendukung spesifikasi Shader Model 3.0. Misalnya nVidia GeForce 6800 atau ATi Radeon X1800. Game yang menggunakan mesin 3D Half-Life 2, seperti Counter-Strike: Source dan Half-Life 2: Aftermath yang akan datang, memungkinkan Anda untuk mengaktifkan rendering HDR pada kartu grafis DirectX 9 lama yang hanya mendukung Pixel Shader 2.0. Contohnya termasuk lini GeForce 5 atau ATi Radeon 9500.

Terakhir, perlu diingat bahwa semua bentuk rendering HDR memerlukan daya pemrosesan yang serius dan dapat membuat GPU yang paling kuat sekalipun bertekuk lutut. Jika Anda ingin bermain game terbaru dengan pencahayaan HDR, grafik performa tinggi sangat diperlukan.

Layar penuh anti-aliasing

Anti-aliasing layar penuh (disingkat AA) memungkinkan Anda menghilangkan karakteristik "tangga" pada batas poligon. Namun perlu diingat bahwa anti-aliasing layar penuh menghabiskan banyak sumber daya komputasi, yang menyebabkan penurunan frekuensi gambar.

Anti-aliasing sangat bergantung pada kinerja memori video, jadi kartu video cepat dengan memori cepat akan dapat menghitung anti-aliasing layar penuh dengan dampak kinerja yang lebih kecil daripada kartu video murah. Anti-aliasing dapat diaktifkan dalam berbagai mode. Misalnya, anti-aliasing 4x akan memberikan gambar yang lebih baik daripada anti-aliasing 2x, tetapi kinerjanya akan sangat baik. Sementara 2x anti-aliasing menggandakan resolusi horizontal dan vertikal, mode 4x melipatgandakannya.

Penyaringan tekstur

Semua objek 3D dalam game memiliki tekstur, dan semakin besar sudut permukaan yang ditampilkan, tekstur akan terlihat semakin terdistorsi. Untuk menghilangkan efek ini, GPU menggunakan pemfilteran tekstur.

Metode penyaringan pertama disebut bilinear dan memberikan garis-garis karakteristik yang tidak terlalu enak dipandang. Situasi membaik dengan diperkenalkannya pemfilteran trilinear. Kedua opsi pada kartu video modern bekerja hampir tanpa penurunan kinerja.

Untuk hari ini paling banyak jalan terbaik penyaringan tekstur adalah penyaringan anisotropik (AF). Mirip dengan FSAA, pemfilteran anisotropik dapat diaktifkan pada level yang berbeda. Misalnya, 8x AF memberikan kualitas pemfilteran yang lebih baik daripada 4x AF. Seperti FSAA, pemfilteran anisotropik memerlukan daya pemrosesan dalam jumlah tertentu, yang meningkat seiring dengan peningkatan level AF.

Tekstur resolusi tinggi

Semua game 3D dibuat dengan spesifikasi khusus, dan salah satu persyaratan tersebut menentukan memori tekstur yang dibutuhkan game tersebut. Semua tekstur yang diperlukan harus sesuai dengan memori kartu video selama permainan, jika tidak, kinerja akan turun secara signifikan, karena permintaan tekstur masuk RAM memberikan penundaan yang cukup lama, belum lagi file paging di hard drive. Oleh karena itu, jika pengembang game mengharapkan memori video sebesar 128 MB persyaratan minimal, maka kumpulan tekstur aktif tidak boleh melebihi 128 MB setiap saat.

Gim modern memiliki banyak set tekstur, sehingga gim akan berjalan lancar di kartu grafis lama dengan VRAM lebih sedikit, serta di kartu baru dengan VRAM lebih banyak. Misalnya, sebuah game mungkin berisi tiga kumpulan tekstur: untuk 128 MB, 256 MB, dan 512 MB. Ada sangat sedikit game yang mendukung memori video 512 MB saat ini, tetapi itu masih menjadi alasan paling obyektif untuk membeli kartu video dengan jumlah memori ini. Meskipun peningkatan memori sedikit atau tidak berpengaruh pada kinerja, Anda akan mendapatkan peningkatan kualitas visual jika game mendukung set tekstur yang sesuai.

Apa yang perlu Anda ketahui tentang kartu video?

Berhubungan dengan

Mungkin sekarang blok ini adalah bagian utama dari chip video. Mereka menjalankan program khusus yang dikenal sebagai shader. Selain itu, jika pixel shader sebelumnya melakukan blok shader piksel, dan yang vertex - blok vertex, maka sejak beberapa waktu arsitektur grafis telah disatukan, dan blok komputasi universal ini telah terlibat dalam berbagai perhitungan: vertex, piksel, geometris, dan bahkan perhitungan universal .

Untuk pertama kalinya, arsitektur terpadu diterapkan dalam chip video konsol game. Microsoft Xbox 360, GPU ini dikembangkan oleh ATI (kemudian dibeli oleh AMD). Dan dalam chip video untuk komputer pribadi unit shader terpadu muncul di papan NVIDIA GeForce 8800. Dan sejak itu, semua chip video baru didasarkan pada arsitektur terpadu yang memiliki kode universal untuk berbagai program shader (vertex, piksel, geometris, dll.), dan prosesor terpadu yang sesuai dapat menjalankan program apapun.

Dengan jumlah unit komputasi dan frekuensinya, Anda dapat membandingkan kinerja matematis dari berbagai kartu video. Sebagian besar game sekarang dibatasi oleh kinerja pixel shader, jadi jumlah blok ini sangat penting. Misalnya, jika satu model kartu video didasarkan pada GPU dengan 384 prosesor komputasi dalam komposisinya, dan yang lain dari garis yang sama memiliki GPU dengan 192 unit komputasi, maka pada frekuensi yang sama, yang kedua akan dua kali lebih lambat. memproses semua jenis shader, dan secara umum akan sama lebih produktif.

Meskipun tidak mungkin untuk menarik kesimpulan yang tidak ambigu tentang kinerja hanya berdasarkan jumlah unit komputasi, sangat penting untuk mempertimbangkan frekuensi jam dan arsitektur blok yang berbeda dari generasi dan produsen chip yang berbeda. Angka-angka ini saja dapat digunakan untuk membandingkan chip dalam lini yang sama dari satu pabrikan: AMD atau NVIDIA. Dalam kasus lain, Anda perlu memperhatikan tes kinerja dalam game atau aplikasi yang diminati.

Unit Tekstur (TMU)

Unit GPU ini bekerja bersama dengan prosesor komputasi untuk mengambil sampel dan memfilter tekstur serta data lain yang diperlukan untuk pembangunan adegan dan komputasi tujuan umum. Jumlah unit tekstur dalam chip video menentukan kinerja tekstur - yaitu, kecepatan pengambilan texel dari tekstur.

Meskipun akhir-akhir ini lebih ditekankan pada perhitungan matematis, dan beberapa tekstur telah diganti dengan yang prosedural, beban pada TMU masih cukup tinggi, karena selain tekstur utama, sampel juga harus dibuat dari peta normal dan perpindahan, seperti serta buffer rendering target render di luar layar.

Mengingat penekanan dari banyak game, termasuk pada performa unit tekstur, kami dapat mengatakan bahwa jumlah TMU dan performa tekstur tinggi yang sesuai juga termasuk di dalamnya. parameter yang paling penting untuk chip video. Parameter ini memiliki efek khusus pada kecepatan rendering gambar saat menggunakan pemfilteran anisotropik, yang memerlukan pengambilan tekstur tambahan, serta dengan algoritme bayangan lembut yang kompleks dan algoritme bermodel baru seperti Oklusi Ambient Ruang Layar.

Unit Operasi Rasterisasi (ROP)

Unit rasterisasi melakukan operasi penulisan piksel yang dihitung oleh kartu video ke dalam buffer dan operasi pencampurannya (pencampuran). Seperti yang kami sebutkan di atas, kinerja unit ROP memengaruhi kecepatan pengisian dan ini adalah salah satu karakteristik utama kartu video sepanjang masa. Dan meskipun baru-baru ini nilainya juga agak menurun, masih ada kasus di mana kinerja aplikasi bergantung pada kecepatan dan jumlah ROP. Hal ini paling sering disebabkan oleh penggunaan aktif filter pasca-pemrosesan dan anti-aliasing yang diaktifkan pada pengaturan game yang tinggi.

Arsitektur GPU: fitur

Realisme grafik 3D sangat bergantung pada kinerja kartu grafis. Semakin banyak blok shader piksel yang dikandung prosesor dan semakin tinggi frekuensinya, semakin banyak efek yang dapat diterapkan pada pemandangan 3D untuk meningkatkan persepsi visualnya.

GPU berisi banyak blok fungsional yang berbeda. Dari jumlah beberapa komponen, Anda dapat memperkirakan seberapa kuat GPU tersebut. Sebelum melanjutkan, mari kita lihat blok fungsional yang paling penting.

Prosesor Vertex (Unit Vertex Shader)

Seperti pixel shader, prosesor vertex mengeksekusi kode shader yang menyentuh simpul. Karena anggaran vertex yang lebih besar memungkinkan Anda membuat objek 3D yang lebih kompleks, kinerja prosesor vertex sangat penting dalam adegan 3D dengan objek yang kompleks atau berjumlah besar. Namun, unit shader vertex masih tidak memiliki dampak yang jelas pada kinerja seperti prosesor piksel.

Prosesor piksel (pixel shader)

Prosesor piksel adalah komponen chip grafis yang didedikasikan untuk memproses program shader piksel. Prosesor ini melakukan perhitungan yang berkaitan dengan piksel saja. Karena piksel berisi informasi warna, pixel shader dapat menghasilkan efek grafis yang mengesankan. Misalnya, sebagian besar efek air yang Anda lihat di game dibuat menggunakan pixel shader. Biasanya, jumlah prosesor piksel digunakan untuk membandingkan kinerja piksel kartu video. Jika satu kartu dilengkapi dengan delapan unit shader piksel dan yang lainnya dengan 16 unit, maka cukup logis untuk mengasumsikan bahwa kartu video dengan 16 unit akan memproses program piksel kompleks lebih cepat. Kecepatan jam juga harus dipertimbangkan, tetapi saat ini menggandakan jumlah prosesor piksel lebih efisien dalam hal konsumsi daya daripada menggandakan frekuensi chip grafis.

Shader terpadu

Shader terpadu (tunggal) belum hadir di dunia PC, tetapi standar DirectX 10 yang akan datang bergantung pada arsitektur serupa. Artinya, struktur kode program vertex, geometris, dan piksel akan sama, meskipun shader akan melakukan pekerjaan yang berbeda. Spesifikasi baru dapat dilihat di Xbox 360, di mana GPU dirancang khusus oleh ATi untuk Microsoft. Akan sangat menarik untuk melihat potensi apa yang dibawa oleh DirectX 10 yang baru.

Unit Pemetaan Tekstur (TMU)

Tekstur harus dipilih dan disaring. Pekerjaan ini dilakukan oleh unit pemetaan tekstur, yang bekerja bersama dengan unit pixel dan shader vertex. Tugas TMU adalah menerapkan operasi tekstur pada piksel. Jumlah unit tekstur dalam GPU sering digunakan untuk membandingkan kinerja tekstur kartu grafis. Cukup masuk akal untuk berasumsi bahwa kartu video dengan lebih banyak TMU akan memberikan performa tekstur yang lebih baik.

Unit Operator Raster (ROP)

RIP bertanggung jawab untuk menulis data piksel ke memori. Tingkat di mana operasi ini dilakukan adalah tingkat pengisian. Pada hari-hari awal akselerator 3D, ROP dan rasio pengisian merupakan karakteristik kartu grafis yang sangat penting. Saat ini, pekerjaan ROP masih penting, tetapi kinerja kartu video tidak lagi dibatasi oleh blok-blok ini seperti dulu. Oleh karena itu, kinerja (dan jumlah) ROP jarang digunakan untuk menilai kecepatan kartu video.

Konveyor

Pipeline digunakan untuk menggambarkan arsitektur kartu video dan memberikan representasi yang sangat visual dari kinerja GPU.

Konveyor tidak dapat dianggap sebagai istilah teknis yang ketat. GPU menggunakan jalur pipa berbeda yang menjalankan fungsi berbeda. Secara historis, pipa dipahami sebagai prosesor piksel yang terhubung ke unit pemetaan tekstur (TMU) miliknya sendiri. Misalnya, kartu video Radeon 9700 menggunakan delapan prosesor piksel, yang masing-masing terhubung ke TMU-nya sendiri, sehingga kartu tersebut dianggap memiliki delapan jalur pipa.

Tetapi sangat sulit untuk mendeskripsikan prosesor modern dengan jumlah saluran pipa. Dibandingkan dengan desain sebelumnya, prosesor baru ini menggunakan struktur modular dan terfragmentasi. ATi dapat dianggap sebagai inovator di bidang ini, yang, dengan lini kartu video X1000, beralih ke struktur modular, yang memungkinkan pencapaian peningkatan kinerja melalui pengoptimalan internal. Beberapa blok CPU digunakan lebih dari yang lain, dan untuk meningkatkan kinerja GPU, ATi telah mencoba menemukan kompromi antara jumlah blok yang dibutuhkan dan area mati (tidak dapat ditingkatkan terlalu banyak). Dalam arsitektur ini, istilah "pipa piksel" telah kehilangan artinya, karena prosesor piksel tidak lagi terhubung ke TMU mereka sendiri. Misalnya, GPU ATi Radeon X1600 memiliki 12 pixel shader dan total empat TMU. Oleh karena itu, tidak dapat dikatakan bahwa arsitektur prosesor ini memiliki 12 pipa piksel, sama seperti tidak dapat dikatakan bahwa hanya ada empat. Namun, menurut tradisi, pipa piksel masih disebutkan.

Dengan mempertimbangkan asumsi ini, jumlah pipeline piksel dalam GPU sering digunakan untuk membandingkan kartu video (dengan pengecualian lini ATi X1x00). Misalnya, jika kita mengambil kartu video dengan 24 dan 16 pipa, maka cukup masuk akal untuk mengasumsikan bahwa kartu dengan 24 pipa akan lebih cepat.


ISI

Apa yang akan dibahas dalam artikel singkat ini?

Artikel ini adalah kumpulan pengetahuan dasar bagi mereka yang ingin memilih kartu video seimbang tanpa memberikan uang tambahan kepada pemasar. Ini akan membantu pemula, serta berfungsi sebagai sumber informasi yang berguna untuk pengguna PC yang lebih mahir. Meski demikian, mini article tetap difokuskan secara khusus untuk pemula.

Tujuan dari kartu video

Bukan rahasia lagi bahwa di zaman kita, bidang aktivitas utama untuk kartu video yang produktif adalah - 3 Dgame, permainan mulus video( HD ), bekerja secara profesional 3D2D dan editor video. Selebihnya, tugas sehari-hari dapat dilakukan tanpa masalah pada kartu video yang terpasang di prosesor atau chipset. Baru-baru ini, untuk kartu video, bidang kegiatan telah diperluas, dalam bentuk komputasi multithread, yang bekerja jauh lebih cepat pada arsitektur paralel kartu video daripada pada prosesor.

NVIDIAmempromosikan platform perangkat lunak dan perangkat kerasnyaCUDAberdasarkan bahasa Xi (omong-omong, berhasil, dan ini tidak mengejutkan ketika menginvestasikan dana semacam itu).AMDsama, kebanyakan mengandalkan open sourceOpenCL.

Dengan menggunakan Anda dapat menyandikan video 3-4 kali lebih cepat. Perangkat keras, kartu video untuk mempercepat produk perusahaanAdobe- secara khusus photoshop, Kilatandan ini sepertinya baru permulaan. Benar, orang-orang yang selalu menggunakan daya komputasi kartu video, secara teoritis sangat sedikit. Dan sepertinya terlalu dini untuk memikirkannya, terutama karena mereka menginjak tumit mereka banyaknuklir prosesor, yang, meskipun lebih lambat dalam operasi multi-utas, memiliki keunggulan yang tidak dapat disangkal karena mereka hanya melakukan tugasnya tanpa pengoptimalan perangkat lunak yang rumit. Dan kesederhanaan dan kemudahan penerapannya, seperti yang ditunjukkan oleh sejarahWindows(misalnya) - bagi orang-orang hal utama dan kunci sukses Perangkat lunak pasar. Dan tetap saja, ada baiknya memberi penghormatan pada daya komputasi kartu video, yang belum dibatasi oleh perangkat lunak yang "benar".

Jadi. NVIDIAatauAMD?

*Pertanyaan paling menarik

Korporasi adalah pemain utama di pasar akselerator grafis.AMD dan NVIDIA.


Semuanya jelas di sini, seperti di banyak sektor pasar, duopoli. Sebagai Pepsi dan Coca-Cola, menyukai Xbox 360 , Bagaimana Intel dan AMD pada akhirnya. Baru-baru ini, perusahaan telah merilis produk mereka satu per satu. Kemudian agar yang satu baik dan yang kedua. Pertama AMD merilis flagship dari lini tersebut, kemudian setelah dua atau tiga bulan, merilis flagship yang lebih bertenaga NVIDIA. Beli kartu dulu AMD, sebagai yang paling kuat, kemudian setelah kartu dirilis NVIDIA yang membelinya kembali ke toko untuk produk yang lebih baik. Hampir sama terjadi dengan pasar menengah dan anggaran. Hanya penyebaran peningkatan kinerja relatif terhadap pesaing yang lebih tinggi di sini, karena untuk menarik konsumen yang lebih hemat, dibutuhkan lebih dari sekadar peluang untuk memiliki kartu video yang lebih baik, seperti yang terjadi di sektor unggulan.

Lebih baik tidak "fanate", karena ini adalah bisnis dan bukan masalah pribadi. Yang utama adalah kartu video itu produktif, dan harganya tidak menggigit. Dan pabrikan mana yang tidak penting. Dengan pendekatan ini, Anda selalu bisa menang dalam hal performa harga.

arsitektur chip.

Kuantitasprosesor piksel (untuk AMD ), konveyor universal (untuk NVIDIA).

Ya. Ini adalah hal yang sangat berbeda. Apa yang dimiliki AMD Radeon HD 5870 1600 unit eksekusi tidak berarti sama sekali bahwa itu akan menjadi 3 kali lebih kuat dariNVIDIA GTX 480 yang ada di kapal 480 blok eksekutif.

NVIDIAMemiliki skalar arsitektur, danAMDskalar super .

arsitektur AMD.

Pertimbangkan arsitektur hal (*prosesor piksel),pada contoh arsitektur skalar super dasar kartu videoRadeon HD 5 episode ( VLIW 5 arah).


Setiap 5 hal buat satu unit eksekusi, yang dapat mengeksekusi maksimal pada satu waktu - 1 skalar operasi dan 1 vektor atau terkadang 5 skalar(namun, kondisinya tidak selalu cocok untuk ini). Setiap operasi vektor membutuhkan 4 hal, setiap skalar 1 hal. Dan di sini, bagaimana hasilnya. PadaNVIDIA sama, masing-masing Inti Cuda, melakukan secara ketat sesuai dengan 1 vektor dan 1 skalar operasi per jam.

Dengan rilis episode 6, nama kode ( Kepulauan Utara ), yaitu chip Cayman, memutuskan untuk meninggalkan tambahan, kelimaALU(Unit-T), yang bertanggung jawab untuk menyelesaikan tugas-tugas kompleks.

Sekarang peran ini dapat dimainkan oleh tiga dari empat blok yang tersisa. Ini memungkinkan pengelola utas untuk diturunkan ( Prosesor Pengiriman Ultra-Threaded), yang digandakan selain untuk meningkatkan pekerjaan dengan geometri dan tesselasi, yang merupakan sisi lemah dari seri 5. Plus, ini memungkinkan Anda menghemat area inti dan anggaran transistor dengan efisiensi yang sama.

Setelah seri keenam, bekerja menuju pengembangan VLIW berakhir, karena fleksibilitasnya yang buruk dan waktu henti yang tinggi karena ketergantungan blok internal satu sama lain (terutama operasi vektor). Arsitektur yang benar-benar baru muncul kedepan Inti Grafis Selanjutnya .

mesin SIMD, digantikan oleh unit komputasi Satuan Hitung (CU), yang memungkinkan Anda meningkatkan tingkat efisiensi dan kinerja arsitektur secara signifikan. Setiap PC sekarang dapat secara mandiri melakukan operasi vektor dan skalar, karena blok kontrol terpisah telah diperkenalkan untuk mereka, yang mendistribusikan sumber daya secara lebih efisien di antara blok bebas. Secara umum, arsitektur mulai mengambil beberapa premis dari arsitektur skalar NVIDIA yang sederhana dan efisien.

Chip pertama dengan arsitektur baru adalah GPU Tahiti di mana mereka membangun AMD RadeonHD7970/7950 . Perusahaan berencana untuk merilis kelas menengah pada arsitektur baru juga.

Sekarang pertimbangkan dasarnya skalar arsitektur NVIDIA .


Seperti yang bisa kita lihat, setiap prosesor universal ( ), per ketukan tampil 1 operasi skalar dan 1 vektor. Ini memungkinkan Anda mencapai kehalusan maksimum. Di mana ada banyak operasi vektor dan skalar, kartu videoAMD dengan arsitektur VLIWlebih rendah, karena mereka tidak dapat memuat blok mereka sebagai kartu videoNVIDIA.

Misalkan pilihan jatuh antaraRadeon HD 5870 dan GeForce GTX 480 .

Pertama 1600pp, kedua 480 blok bersatu.

Hitung: 16005=320 blok superscalar, y Radeon HD5870.

Artinya, per siklus, kartu video dariAMD, tampil dari 320 hingga 1600 operasi skalar dan dari 0 sampai 320 vektor mengambang, tergantung pada sifat masalahnya.

Dan dengan frekuensi ganda dari domain shader, peta pada arsitekturFermi, secara teoritis harus memenuhi 960 vektor dan 960 skalar operasi per siklus.

Namun Radeon , memiliki frekuensi yang lebih disukai daripada kartu dari "kamp hijau" (700 vs. 850). Jadi, angka-angka iniNVIDIA, secara teoritis, mereka harus sama seperti ketika domain shader beroperasi pada frekuensi 1700 MHz (850 x 2=1700), padahal tidak. Pada frekuensi 1401 MHz, GTX 480 menghasilkan ~ 700 vektor dan ~ 700 skalar operasi per siklus.

* jangan mengandalkan keandalan perhitungan ini, mereka hanya teoretis. Selain itu, pernyataan ini tidak berlaku dari seri ke-6 Radeon dimulai dengan keripik Cayman.

Karena kenyataan itu jumlah maksimum operasi vektor dan skalar dilakukan dengan angka yang sama, arsitekturNVIDIAmemiliki yang terbaik kelancaran dalam adegan yang sulit daripada AMD VLIW (<5 series).

Kategori harga dan apa yang kami dapatkan jika kami membeli kartu video dari seri yang lebih muda.

Insinyur AMD, tanpa ragu, mereka memotong setengah dari prosesor piksel, bus memori, dan sebagian lagiROP's generasi kartu, dari segmen ke kelas di bawah ini. Sebagai contohRadeon HD5870 Memiliki 1600pp, ban 256 sedikit, dan masuk 577 0, tepat setengahnya tersisa - 800 , dan bus memori 128 sedikit. Situasi yang sama berlanjut ke kartu video dengan anggaran paling banyak. Jadi, akan selalu lebih baik untuk membeli kartu video yang lebih lemah dari seri 58** daripada yang tertua dari seri 57**.

Insinyur NVIDIApendekatan yang tidak jauh berbeda. Halus, bus memori yang dipangkas, jalur pipa universal,ROP's , pipa piksel. Tetapi frekuensinya juga berkurang, yang dengan sistem pendingin yang tepat dapat sedikit dikompensasi dengan overclocking. Agak aneh bahwa bukan sebaliknya, seperti yang terjadiAMD, meningkatkan frekuensi pada kartu dengan jumlah aktuator yang terpotong.

Pendekatan AMD lebih bermanfaat bagi produsen, pendekatan NVIDIA- kepada pembeli.

Sebutkan tentang driver.

Justru karena fitur arsitektur superscalar VLIW, driver dari AMD, Anda harus terus mengoptimalkan agar kartu video memahami kapan perlu menggunakan vektor atau skalar seefisien mungkin.

Driver terpadu dariNVIDIAlebih kebal terhadap mesin game yang berbeda karena fakta bahwa para insinyurNVIDIAseringkali selama pengembangan game mereka mengoptimalkannya untuk arsitektur chip dan driver video mereka. Perlu juga dicatat bahwa saat menginstal dan menghapusnya, praktis tidak ada masalah yang melekat pada driverAMD.

Driver NVIDIA dapat diinstal langsung pada yang lama, tanpa penghapusan dan tanpa pembersihan registri. Kami berharap para programmerAMDakan bergerak ke arah yang sama. Sekarang Anda dapat mengunduh "perbaikan" untuk driverKatalisator, yang dirilis sesaat sebelum rilis game untuk dijual atau beberapa saat kemudian. Sudah sesuatu. Dan dengan dirilisnya arsitektur baru Inti Grafis Selanjutnya, pekerjaan pengoptimalan driver akan sangat dimudahkan.

pipa piksel, TMU, ROP.

Juga, jumlahnya sangat penting. pipa piksel dan TMU (blok overlay tekstur), jumlahnya sangat penting pada resolusi tinggi dan saat menggunakan pemfilteran tekstur anisotropik ( pipa piksel itu penting), menggunakan kualitas tekstur tinggi dan pengaturan penyaringan anisotropik tinggi (TMU penting).

Jumlah blokROP (blok operasi raster ), terutama mempengaruhi kinerja anti-aliasing, tetapi jika kurang, mungkin ada kerugian dalam kinerja keseluruhan. Semakin banyak, anti-aliasing yang lebih tidak mencolok akan memengaruhi jumlah frame per detik. Juga, kinerja anti-aliasing sangat dipengaruhi oleh jumlah memori video.

Volume, frekuensi, dan lebar bit bus memori.

Semakin banyak memori video yang dimiliki kartu video, semakin baik. Namun, itu tidak layak membeli dalam jumlah besar.

Seperti yang sering terjadi, pada kartu video yang relatif lemah, mereka menggunakan memori video dalam jumlah yang luar biasa, dan bahkan lambat (misalnya, aktifGeforce 8500 GT, beberapa OEMprodusen memakai 2 GB DDR2 memori video). Dari sini, kartu video tidak akan lepas landas, dan kinerja tidak akan ditambahkan.

* dibandingkan dengan 8500 GT512mb

Pilihan yang jauh lebih baik adalah mendapatkan kartu video dengan memori lebih cepat, tetapi volume lebih sedikit. Misalnya, jika pilihannya adalah: ambil 9800 GTDengan 512 atau 1024mb memori, dengan frekuensi 1000MHz dan 900MHz karenanya, akan lebih baik untuk mengambil 9800 GT Dengan 512mb Penyimpanan. Selain itu, kartu video pada level ini tidak membutuhkan lebih dari memori video 512mb.

Bandwidth Memori - ini adalah hal utama dalam kinerja subsistem memori video, yang paling penting memengaruhi kinerja kartu video secara keseluruhan. Diukur dalam Gb/s (gigabyte per detik).

Misalnya, jenis memori videoGDDR5 , yang memiliki potensi frekuensi yang jauh lebih tinggi daripadaGDDR3 , dan karenanya lebih putih tinggi throughput.

Namun, frekuensi bukanlah segalanya. Faktor penting kedua adalah lebar bus memori. Semakin tinggi kedalaman bit, semakin cepat memori.

Misalnya, memori dengan frekuensi 1000MHz dan bis 256 sedikit, akan menjadi tepat 2 kali lebih cepat Penyimpanan 1000MHz dan bis 128 sedikit. Semakin tinggi kedalaman bit, semakin cepat memori. Bus memori terluas yang ada adalah monster 896 sedikit(448 x2 ) pada kartu video GeForce GTX295 . Namun, ini menggunakan memoriGDDR3 , yang secara signifikan menurunkan throughput (frekuensi kurang efektif) dibandingkan denganGDDR5 . Oleh karena itu, throughputnya bahkan sedikit lebih rendah dari ituRadeon HD 5970 Dengan 512 sedikit(256 x 2) tetapi dengan GDDR5 .

Sistem pendingin.

Semakin efisien sistem pendingin, semakin kecil kemungkinan kartu grafis Anda gagal. Kartu akan terlalu panas lebih sedikit, yang akan meningkatkan stabilitas sistem secara keseluruhan, sangat meningkat seumur hidup, serta meningkat potensi overclocking.

Diproduksi, siapDengansistem tentang kartu video pendingin datang dalam dua variasi.



Referensi (dari pabrikan) dan alternatif (dari mitra pabrikan). Biasanya, kartu referensi memiliki desain turbin (, peniup), dan biasanya sangat andal. Relatif berisik, tidak selalu seefisien alternatif JADI dari mitra pabrikan dan lebih tersumbat debu. Meski saat digunakan, sistem pendingin blower untuk kartu video sangat efisien dan senyap. Jika sedikit kebisingan di bawah beban tidak mengganggu Anda, dan Anda tidak akan mencetak rekor dalam overclocking, sistem pendingin referensi lebih disukai. Biasanya, mitra pabrikan merekatkannya dengan stiker dengan logo mereka, perubahan hanya dimungkinkan di BIOS kartu video (kontrol kecepatan kipas), jadi beberapa kartu memiliki desain yang identik, tetapi dari pabrikan yang berbeda, lebih berisik atau lebih panas daripada rekan mereka dan dan sebaliknya. Setiap pabrikan memiliki preferensi dan ketentuan garansi sendiri. Oleh karena itu, beberapa mengorbankan kesunyian demi stabilitas dan daya tahan yang lebih baik.



Jika itu penting bagimu kesunyian, perlu diperhatikan sistem alternatif pendinginan dengan peningkatan efisiensi, dengan tingkat kebisingan yang lebih rendah (misalnyaUap-x, EsQ, , DirectCu), atau pilih kartu video dengan sistem pendingin pasif, yang jumlahnya semakin banyak sekarang.

* Nasihat: jangan lupa untuk mengubah antarmuka termal satu atau dua tahun sekali, terutama untuk CO dengan teknologi kontak pipa panas langsung. Pasta termal mengeras, membentuk lapisan yang menghantarkan panas dengan buruk, yang menyebabkan kartu video terlalu panas.

Konsumsi daya kartu video.

Karakteristik yang sangat penting saat memilih, karena kartu video adalah komponen komputer yang sangat rakus, jika bukan yang paling rakus. Kartu grafis teratas terkadang mendekati sasaran 300W. Oleh karena itu, saat memilih, Anda harus mempertimbangkan apakah catu daya Anda mampu memberikan catu daya yang stabil ke kartu video. Jika tidak, sistem mungkin tidak mau hidup karena ketidaksesuaian voltase saat lewat POS, mungkin ada ketidakstabilan dalam pengoperasian dan shutdown yang tidak terduga, reboot atau panas berlebih pada komponen komputer, atau catu daya mungkin terbakar begitu saja.

Di situs web pabrikan atau kotak kartu video, karakteristik minimum tertulis, di antaranya adalah daya minimum catu daya. Nilai-nilai ini ditulis untuk semua blok, termasuk yang berbahasa Mandarin. Jika Anda yakin memiliki catu daya berkualitas tinggi, Anda dapat mengurangi nilai ini 50-100W.

Anda dapat secara tidak langsung menentukan konsumsi daya dengan jumlah konektor daya tambahan pada kartu video.

Tidak ada - kurang 75W, satu 6 pin sebelum 150W, dua 6 pin sebelum 225W, 8 pin + 6 pin - sebelum 300W. Pastikan blok Anda memiliki konektor yang diperlukan atau ada adaptor 4-pin dalam kit molex-s. Atau beli sebagai tambahan, dijual bebas di toko komputer.

Kurangnya catu daya ke kartu video dapat menyebabkannya terlalu panas, munculnya artefak, dan kegagalan sistem daya. Kartu video NVIDIA, jika ada kekurangan daya, mereka mungkin mulai memperingatkan dengan pesan seperti: "driver video berhenti merespons dan telah dipulihkan" atau "sambungkan daya tambahan ke kartu video".

Konsumsi daya tinggi = pembuangan panas tinggi. Jika kartu video Anda menghabiskan banyak daya, rawat kipas tambahan untuk asupan dan pembuangan pada casing. Atau, sebagai tindakan sementara, buka penutup samping. Suhu yang terus-menerus tinggi dalam casing - berdampak buruk pada jalur layanan semua komponen, dari motherboard hingga.

Konektor.

Ketika Anda telah memutuskan kartu video, Anda harus memperhatikan konektornya.


Jika Anda memiliki monitor dengan matriks P- atau dengan dukungan warna 30 bit (1,07 miliar), maka Anda pasti membutuhkannya pelabuhan layar pada kartu video untuk membuka potensinya. Hanya pelabuhan layar mendukung transmisi 30 bit kedalaman warna.

* tidak diketahui secara pasti apakah kartu video game mendukung transmisi 30-bit, tetapi keberadaannya pelabuhan layar berbicara tentang kemungkinan dukungan. Dalam spesifikasi, dukungan hanya dinyatakan untuk kartu video profesional AMD Api Pro dan NVIDIA Quadro.

Sangat bagus jika ada . Anda tidak pernah tahu apa yang mungkin berguna dan yang terbaik adalah bersiap untuk itu. Tiba-tiba Anda perlu mengeluarkan sinyal dari penerima. Ngomong-ngomong, HDMI dan DVI kompatibel melalui adaptor sederhana dan hampir tanpa masalah.

Temuan.

Itu saja. Kita bahkan belum mulai, kita sudah selesai. Karena artikel tersebut menjelaskan konsep utama dan umum, ternyata tidak terlalu panjang.

Namun demikian, semua poin terpenting untuk memilih kartu video berkualitas tinggi dan produktif telah dijelaskan.

1. Masalah iman.

3. Jumlah unit eksekusi (TMU, ROP, dll.).

4. Volume, frekuensi dan lebar bus memori.

5. Cari tahu apakah kartu tersebut cocok untuk tingkat konsumsi daya.

5. Sistem pendingin.

6. Konektor.

Kami berharap dengan pengetahuan ini, Anda dapat memilih kartu video sesuai dengan kebutuhan Anda.

Semoga beruntung dengan pilihan mu!