T­a­c­h­y­u­m­ ­1­2­8­ ­Ç­e­k­i­r­d­e­k­l­i­ ­İ­ş­l­e­m­c­i­y­i­ ­A­n­l­a­t­ı­y­o­r­:­ ­5­.­7­ ­G­H­z­,­ ­9­5­0­W­,­ ­1­6­ ­D­D­R­5­ ­K­a­n­a­l­

T­a­c­h­y­u­m­ ­1­2­8­ ­Ç­e­k­i­r­d­e­k­l­i­ ­İ­ş­l­e­m­c­i­y­i­ ­A­n­l­a­t­ı­y­o­r­:­ ­5­.­7­ ­G­H­z­,­ ­9­5­0­W­,­ ­1­6­ ­D­D­R­5­ ­K­a­n­a­l­


Tachyum, Hot Chips 18’de Prodigy Evrensel İşlemci konseptini tanıttığında, dinamik bir ikili çevirici kullanarak herhangi bir kodu çalıştırmak için tasarlanmış bir çip ile oldukça ses getirdi. Hem yerel hem de çevrilmiş kodu yürütürken yüksek performans gösterdi. Şirketin gerçek donanımı tasarlaması biraz zaman aldı. değerlendirme kitleri için ön sipariş almak (yeni sekmede açılır); şirket ayrıca Prodigy’nin tam özelliklerini de açıklar. Kesinlikle etkileyici görünüyorlar, ancak çip başına 950W termal tasarım gücüyle de korkutucular.

Müthiş Güçte Müthiş Performans

Her Tachyum Prodigy işlemci, 7200 MT/s’ye kadar veri aktarım hızını destekleyen (ve dolayısıyla 921.6 GBps’ye kadar bant genişliği sağlayan) 16 DDR5 bellek kanalıyla (1.024 bit arabirim için) eşleştirilmiş 128’e kadar tescilli çekirdeğe ve 64 PCIe’ye sahiptir. 5.0 şerit. Ek olarak, çip toplamda 8 TB’a kadar DDR5 belleği destekler; bu, diğer üreticilerin gelecek sunucu CPU’larında göreceğimiz ile uyumludur. Saat hızlarına gelince, Tachyum’s Prodigy, 5,7 GHz’e kadar çalışacak şekilde tasarlanmıştır ve TSMC’nin performans açısından optimize edilmiş N5P işlem teknolojisinin bir ürünüdür.

Performans söz konusu olduğunda, Tachyum amiral gemisini bekliyor Prodigy T16128-AIX işlemci (yeni sekmede açılır) HPC için 90 adede kadar FP64 TFLOPS ve muhtemelen yerel kod çalıştırırken ve 950 W’a kadar (ve sıvı soğutma kullanırken) çıkarım ve eğitim için 12 adede kadar ‘AI PetaFLOPS’ sunmak için, spesifikasyonlara göre yayınlanan (yeni sekmede açılır) şirket tarafından ve Golem.de (yeni sekmede açılır). Bu arada Tachyum’un Prodigy işlemcileri 2 yönlü ve 4 yönlü konfigürasyonlarda çalışabilir. Rakamları bağlama oturtmak gerekirse, AMD’nin Instinct MI250X’i, yaklaşık 560W’ta HPC için 96 FP64 TFLOPS’luk bir tepe verimine sahiptir. Buna karşılık, Nvidia’nın H100 SXM5’i, 700 W’ta AI için 20 adede kadar INT8/FP8 PetaOPS/PetaFLOP (seyreklik ile 40 PetaOPS/PetaFLOPS) sağlayabilir. Ancak, genel amaçlı iş yükleri için hesaplama GPU’ları da işlev görmez. Ve işte tam da o zaman ilginçleşiyor.

Yeni Bir CPU Doğuyor

Tachyum’s Prodigy, çekirdek başına iki 1024 bit vektör birimi ve çekirdek başına bir 4096 bit matris birimi içeren 128 tescilli 64 bit VLIW çekirdeğini paketleyen evrensel homojen bir işlemcidir. Ayrıca her çekirdekte 64KB talimat önbelleği, 64KB veri önbelleği, 1MB L2 önbellek bulunur ve diğer çekirdeklerin kullanılmayan L2 önbelleklerini kurban L3 önbelleği olarak kullanabilir.

Tachuym’un CEO’su ve kurucu ortağı Radoslav Danilak’a göre, Tachyum’un VLIW çekirdekleri sıralı çekirdekler, ancak derleyiciler uygun optimizasyonlar yaptığında 4 yollu sıra dışı sorunları destekleyebilirler. Golem.de (yeni sekmede açılır). Ayrıca, Prodigy komut seti mimarisinin, sözde zehirli bitleri kullanan yazılımlarla çok yüksek bir talimat düzeyinde paralellik elde edebileceğini yeniden vurguladı.

Popular Articles

Latest Articles