![AMD, Exascale HPC için Instinct MI210 PCIe Kartını Tanıttı](https://kilalu.blog/news/2024-07-29-22:05/AMD, Exascale HPC için Instinct MI210 PCIe Kartını Tanıttı.jpg)
AMD, bilgi işlem performansına ihtiyaç duyan veri merkezleri, sunucular ve iş istasyonları için Instinct MI210 PCIe hızlandırıcı kartını resmi olarak tanıttı. Instinct MI210, bir CDNA 2 hesaplama GPU’sunu temel alır ve 64 GB HMB2E bellek taşır. Bu kartla AMD, Nvidia’nın on yılı aşkın süredir başarılı olduğu ticari yüksek performanslı bilgi işlem (HPC) pazarındaki saldırısını başlatıyor.
Çift yonga kullanan daha büyük MI250/MI250X’in aksine, AMD Instinct MI210 kartı, 104 işlem birimi (6656 akış işlemcisi) içeren tek bir CDNA 2 grafik hesaplama kalıbı (GCD) kullanır ve 64 GB HBM2E ECC belleği 4096 bit arabirim kullanır . Kartın 2 yönlü ve 4 yönlü Infinity yapı konektörleri vardır, bu nedenle iki veya dört kart tek bir sistemde birlikte çalışarak performansı ikiye veya dört katına çıkarabilir. Anakart, pasif bir çift geniş soğutma sistemi kullanır, bu nedenle tipik masaüstü PC’niz için değil, rafa monte sunucular veya özel iş istasyonları için tasarlanmıştır. Bir adet sekiz pimli yardımcı PCIe güç konektörü gerektirir; bu, PCIe yuvasını ve konektörünü kullanarak maksimum güç tüketiminin yalnızca 225W olduğu anlamına gelir.
Hesaplama yetenekleri açısından, Instinct MI210 kartı, diğer Instinct MI200 serisi CDNA 2 hesaplama GPU’ları tarafından desteklenen aynı veri biçimlerini (FP64/FP32 vektör/matris, FP16, bfloat16, INT8) destekler, ancak performans açısından Instinct MI210, iki GCD’ye sahip olan, bir OCP hızlandırıcı modülü (OAM) form faktörüne sahip olan ve doğal olarak önemli ölçüde daha fazla güç tüketen Instinct MI250’nin yarısını sunar.
AMD’nin Instinct MI210 anakartının bariz rakibi, yaklaşık bir yıl önce piyasaya sürülen Nvidia’nın A100 80GB PCIe kartıdır (80GB versiyonunda). Kağıt üzerinde, AMD’nin CDNA 2 tabanlı çözümü, FP64/FP32 vektör ve matris işlemlerinde rakibini iki kat geride bırakıyor. Buna karşılık, Nvidia’nın A80’i FP16, bfloat16 ve INT8 gibi AI/ML’ye özgü formatlarla daha hızlıdır.
İçgüdü MI210 | Nvidia A100 80GB PCIe | İçgüdü MI250 | İçgüdü MI250X | |
Hesaplama Birimleri | 104 | – | 208 | 220 |
Akış İşlemcileri | 6.656 | 6.912 | 13.312 | 14,080 |
FP64 Vektörü (Tensor) | 22,6 TFLOP | 9.7 TFLOP | 45.3 TFLOP | 47.9 TFLOP |
FP64 Matrisi | 45.3 TFLOP | 19,5 TFLOP | 90,5 TFLOP | 95,7 TFLOP |
FP32 Vektör | 22,6 TFLOP | 9.7 TFLOP (?) | 45.3 TFLOP | 47.9 TFLOP |
FP32 Tensör Şamandırası | – | 156 | 312 TFLOP | – | – |
FP32 Matrisi | 45.3 TFLOP | 19,5 TFLOP | 90,5 TFLOP | 95,7 TFLOP |
FP16 | 181 TL | 312 | 624* TFLOPS | 362.1 TFLOPS | 383 TFLOP |
bfloat16 | 181 TL | 312 | 624* TFLOPS | 362.1 ÜSTLER | 383 ÜÇ |
INT8 | 181 ÜÇ | 624 | 1248 ÜST | 362.1 ÜSTLER | 383 ÜÇ |
HBM2E ECC Bellek | 64 GB | 80 GB | 128 GB | 128 GB |
Bellek Bant Genişliği | 1,6 TB/sn | 1.935 TB/sn | 3,2 TB/sn | 3,2 TB/sn |
Form faktörü | PCIe kartı | PCIe kartı | OAM | OAM |