AMD MI300X şimdiye kadarki en hızlı Geekbench 6 OpenCL skorunu elde etti; RTX 4090’dan %19 daha hızlı ve yalnızca on iki kat daha pahalı

AMD’nin ateş püskürten MI300X GPU’su resmi olarak görücüye çıktı Geekbench 6 OpenCLRTX 4090 gibi önceki grafik liderlerini geride bırakıyor. Bununla birlikte, Geekbench 6 listelerindeki en hızlı GPU’lardan biri olmasına rağmen AMD GPU’nun puanı gerçek performansını yansıtmıyor ve veri merkezi AI GPU’larını kullanarak karşılaştırma yapmanın neden berbat bir fikir olduğunu gösteriyor. tüketici sınıfı OpenCL uygulamaları (Geekbench 6 budur).

Yine de kıyaslama rakamlarını aradan çıkaralım. MI300X, Geekbench 6.3.0’ın GPU odaklı OpenCL değerlendirmesinde 379.660 puan alarak Geekbench tarayıcısında bugüne kadarki en hızlı GPU’yu oluşturuyor. (Listede yer almadığını unutmayın. resmi OpenCL sonuç sayfası (yine de.) Bu da ona, ironik bir şekilde, başka bir kurumsal GPU olan Nvidia L40S’in aldığı ikinci en yüksek puanın önünde, pole pozisyonunu veriyor. L40S 352.507’yi başardı ve bu da RTX 4090’ın 319.583 sonucunu %10 geride bıraktı.

Yani MI300X şu anda tüm rakiplerini geride bırakarak RTX 4090’ı (listedeki en hızlı tüketici GPU’su) 60.077 puan veya %18,8 geride bırakıyor. Açıkçası, diğer faktörler bu GPU’lardan bazılarını geride tutuyor; Nvidia’nın H100 PCIe’si de listede yalnızca 281.868 gibi düşük bir puanla yer alıyor. Başka bir deyişle, Geekbench 6 OpenCL’i kurumsal düzeyde donanım için bir ölçüm çubuğu olarak kullanmayın. Bu, aracın hızlanmasını ve yol tutuşunu kontrol etmek için okul bölgesinde bir Formula 1 arabasını sürmeye benzer.

Yatay kaydırmak için kaydırın

Geekbench 6 OpenCL Skorları
GPU	OpenCL
AMD Instinct MI300X	379.660
Nvidia L40S	352.507
RTX 4090	319.583
Nvidia H100 PCIe	281.868

Bu kıyaslamada her şeyin doğru olmayabileceğini hızlı bir şekilde görmek için sıralamalara bakmanız yeterlidir. RTX 4090, RTX 4080 Super’i %28 oranında geride bırakıyor; bu tamamen şüphe götürmez bir sonuç değil, ancak aynı mimariyi kullanıyor. Bu arada RTX 4080 Super, AMD’nin en iyi tüketici GPU’su olan RX 7900 XTX’i %21 oranında geride bırakıyor. Eğer bu bir ışın izleme veya yapay zeka performans testi olsaydı, bu söz konusu olmazdı, ancak genel olarak FP32 hesaplama performansında 7900 XTX, bu sonuçların önerdiğinden çok daha yakın olma eğilimindedir. Ve yine, MI300X ve H100 gibi veri merkezi GPU’larından elde edilen çoğu zaman korkunç sonuçlara bakmıyoruz bile.

Spesifik olarak, AMD MI300X GPU kendi liginde olmalı. 304 CDNA3 Hesaplama Birimi (CU) ve 163,4 TFLOPS FP32 performansıyla eşleştirilmiş, 5,3 TB/s bant genişliğine sahip 192 GB HBM3 belleğe sahiptir. Ve bu onun güçlü tarafı bile değil. Bir AI GPU olarak aynı zamanda 2,6 petaflop FP16 veriminin yanı sıra 2.600 TOPS çıkarım performansına da sahiptir; bu, Copilot+’ın 40 TOPS gereksinimini bir nevi utandırıyor. MI300X aynı zamanda 750W’lık en yüksek güç derecesine sahip ciddi güç gereksinimleriyle birlikte gelir.

MI300X, AMD’nin en yeni kurumsal GPU’sudur ve Nvidia’nın H100 ve H200 AI GPU’ları ile rekabet edecek şekilde tasarlanmıştır. GPU, AMD’nin CDNA 3 grafik mimarisinden yararlanıyor ve yoğun olarak 3D yığınlama teknolojilerinden yararlanıyor. Aslında GPU’nun kendisi o kadar büyük ki geleneksel PCIe grafik kartı form faktöründe gelmiyor. Uygun AI tabanlı kıyaslamalarda MI300X’in, bırakın RTX 4090’ı, Nvidia’nın H100’ünden %60’a kadar daha hızlı olduğu iddia ediliyor.

Buna karşılık RTX 4090, FP32 performansı açısından AMD çipinin ancak yarısı kadar güçlü. 24 GB GDDR6X ve 1 TB/s bellek bant genişliği, 82,6 TFLOPS FP32 hesaplamalı 128 SM ve 1.321 TOPS AI performansı içerir. Güç tüketimi de 450W ile önemli ölçüde daha düşüktür.

MI300X’in Geekbench 6 çıkışı, böyle bir testin daha yüksek performanslı GPU’ları ölçmek için ne kadar zayıf olduğunu ortaya koyuyor. Elbette, bazen sonuçlar çok da uçuk olmayabilir, ancak OpenCL sürücü optimizasyonları tek başına potansiyel performansın büyük bir kısmını oluşturuyor olabilir. Test çok çeşitli donanımlarda çalışabilir — örnek olarak Qualcomm’un Snapdragon X Elite’i 23.493 puan aldı — ancak açıkça tüm potansiyel iş yükleri için ayarlanmamış. Çoğu sentetik kıyaslama gibi, yalnızca musluktaki potansiyel performansın çok dar bir dilimine bakıyor.

Ve bu, kıyaslamalara bakan insanlar bunların ne anlama geldiğini bildiği sürece sorun değil. MI300X sonucunun, GPU’yu değerlendirmek için ciddi bir çaba harcamaktan ziyade, AMD’nin MI300X’ine erişimi olan birinin Geekbench 6’da neler olacağını görmekten biraz eğlenmesi olduğundan oldukça eminiz. Aynı testte bir süper bilgisayar kümesindeki 1,2 milyon GPU’nun nasıl olduğunu görmek için sabırsızlanıyoruz.

genel-21

Popular Articles

Latest Articles

Other Articles