AMD, bir süredir merakla beklenen MI300X’in resmi tanıtımını yaptı. TSMC’nin gelişmiş üretim hattından çıkan AMD MI300X GPU, NVIDIA’nın H100’ünden yüzde 60 daha yüksek performans sunmayı başarıyor. İşte detaylar…

AMD MI300X neler sunuyor?

AMD, eğitim performansında MI300X’in H100 ile benzer seviyede olduğunu ve inferans iş yüklerinde üstün performans sergilediğini belirtiyor. Şirketin açıklamalarına göre MI300X, genel özelliklerde şu avantajları sağlıyor:

  • 2.4 kat daha yüksek bellek kapasitesi
  • 1.6 kat daha yüksek bellek bant genişliği
  • 1.3 kat FP8 TFLOPS
  • 1.3 kat FP16 TFLOPS
  • Llama 2 70B, birebir kıyaslamada yüzde 20’ye kadar daha hızlı
  • FlashAttention 2, birebir kıyaslamada yüzde 20’ye kadar daha hızlı
  • Llama 2 70B, 8v8 sunucuda yüzde 40’a kadar daha hızlı
  • FlashAttention 2, 8v8 sunucuda yüzde 60’a kadar daha hızlı

MI300X’in arkasındaki yazılım, ROCm 6.0, çeşitli yapay zeka iş yüklerini destekleyen yeni özellikler içeriyor. Zira bu yazılım, en yeni hesaplama formatlarını destekleyerek performansı artırıyor. MI300X, NVIDIA’nın Hopper ve Intel’in Gaudi yapay zeka hızlandırıcılarına karşı rekabeti artıracak. CDNA 3 mimarisine dayanan MI300X, toplamda 153 milyar transistöre sahip. Ayrıca MI300X’in bellek kapasitesi 192 GB (HBM3). Yani selefi MI250X’e göre yüzde 50 daha fazla.

AMD, Ryzen 8040 serisini tanıttı! Yapay zeka ile sınırları zorluyor

AMD, Ryzen 8040 serisini tanıttı! Yapay zeka ile sınırları zorluyor

AMD bugün düzenlediği etkinlikte yeni Ryzen 8040 serisi mobil işlemci modellerini ve Ryzen AI yapay zeka ünitesini tanıttı.

AMD MI300X, güç tüketimi tarafında 750W TDP ile karşımıza çıkıyor. Ek olarak AMD, bu çipi destekleyen sistemleri sergilerken, 8 MI300X GPU hızlandırıcısı ve iki AMD EPYC 9004 CPU içeren bir konfigürasyonu paylaştı.

Son olarak, AMD’nin Instinct MI300 AI çiplerini destekleyeceğini açıklayan şirketler arasında Oracle, Dell, META ve OpenAI gibi büyük isimler bulunuyor. Şirketin yapay zeka alanında sadece bir alternatif olmak değil, lider olma hedefi olduğu için NVIDIA ve Intel gibi rakipleri için de ciddi bir rekabet ortamı yaratıyor.

GPUAMD INSTINCT MI400AMD INSTINCT MI300XAMD INSTINCT MI300AAMD INSTINCT MI250XAMD INSTINCT MI250AMD INSTINCT MI210AMD INSTINCT MI100AMD RADEON INSTINCT MI60AMD RADEON INSTINCT MI50AMD RADEON INSTINCT MI25AMD RADEON INSTINCT MI8AMD RADEON INSTINCT MI6
CPU MimarisiZen 5 (Exascale APU)YokZen 4 (Exascale APU)YokYokYokYokYokYokYokYokYok
GPU MimarisiCDNA 4Su Vanjaramı (CDNA 3)Su Vanjaramı (CDNA 3)Aldebaran (CDNA 2)Aldebaran (CDNA 2)Aldebaran (CDNA 2)Arkturus (CDNA 1)Vega 20Vega 20Vega 10Fiji XTPolaris10
GPU İşlem Düğümü4nm5nm+6nm5nm+6nm6nm6nm6nm7 nm FinFET7 nm FinFET7 nm FinFET14 nm FinFET28nm14 nm FinFET
GPU Yongalarıhenüz bilinmiyor8 (MCM)8 (MCM)2 (MCM)
1 (Kalıp Başına)
2 (MCM)
1 (Kalıp Başına)
2 (MCM)
1 (Kalıp Başına)
1 (Monolitik)1 (Monolitik)1 (Monolitik)1 (Monolitik)1 (Monolitik)1 (Monolitik)
GPU Çekirdeklerihenüz bilinmiyor19.45614.59214.08013.3126656768040963840409640962304
GPU Saat Hızıhenüz bilinmiyor2100 MHz2100 MHz1700 MHz1700 MHz1700 MHz1500 MHz1800 MHz1725MHz1500 MHz1000 MHz1237 MHz
INT8 Hesaplamahenüz bilinmiyor2614 ÜST1961 ÜSTLERİ383 ÜST362 ÜST181 ÜST92.3 ÜSTLERYokYokYokYokYok
FP16 Hesaplamahenüz bilinmiyor1.3 PFLOP’lar980,6 TFLOP383 TFLOP362 TFLOP181 TFLOP185 TFLOP29,5 TFLOP26,5 TFLOP24.6 TFLOP8.2 TFLOP’lar5.7 TFLOP’lar
FP32 Hesaplamahenüz bilinmiyor163,4 TFLOP122,6 TFLOP95,7 TFLOP90,5 TFLOP45.3 TFLOP23.1 TFLOP’lar14.7 TFLOP’lar13.3 TFLOP’lar12.3 TFLOP’lar8.2 TFLOP’lar5.7 TFLOP’lar
FP64 Hesaplamahenüz bilinmiyor81.7 TFLOP61.3 TFLOP47,9 TFLOP45.3 TFLOP22.6 TFLOP11.5 TFLOP7.4 TFLOP’lar6.6 TFLOP768 GFLOP512 GFLOP384 GFLOP
VRAMhenüz bilinmiyor192 GB HBM3128 GB HBM3128 GB HBM2e128 GB HBM2e64 GB HBM2e32 GB HBM232 GB HBM216 GB HBM216 GB HBM24 GB HBM116 GB GDDR5
Infinity Önbelleğihenüz bilinmiyor256 MB256 MBYokYokYokYokYokYokYokYokYok
Memory Clockhenüz bilinmiyor5,2 Gb/sn5,2 Gb/sn3,2 Gb/sn3,2 Gb/sn3,2 Gb/sn1200 MHz1000 MHz1000 MHz945 MHz500 MHz1750 MHz
Bellek Veri Yoluhenüz bilinmiyor8192-bit8192-bit8192-bit8192-bit4096 bit4096 bit veri yolu4096 bit veri yolu4096 bit veri yolu2048 bit veri yolu4096 bit veri yolu256 bit veri yolu
Bellek Bant Genişliğihenüz bilinmiyor5,3 TB/sn5,3 TB/sn3,2 TB/sn3,2 TB/sn1,6 TB/sn1,23 TB/sn1 TB/sn1 TB/sn484 GB/sn512 GB/sn224 GB/sn
Soğutmahenüz bilinmiyorPasif SoğutmaPasif SoğutmaPasif SoğutmaPasif SoğutmaPasif SoğutmaPasif SoğutmaPasif SoğutmaPasif SoğutmaPasif SoğutmaPasif SoğutmaPasif Soğutma
TDP (Maks.)henüz bilinmiyor750W760W560W500W300W300W300W300W300W175W150W