AMD, bir süredir merakla beklenen MI300X’in resmi tanıtımını yaptı. TSMC’nin gelişmiş üretim hattından çıkan AMD MI300X GPU, NVIDIA’nın H100’ünden yüzde 60 daha yüksek performans sunmayı başarıyor. İşte detaylar…
AMD MI300X neler sunuyor?
AMD, eğitim performansında MI300X’in H100 ile benzer seviyede olduğunu ve inferans iş yüklerinde üstün performans sergilediğini belirtiyor. Şirketin açıklamalarına göre MI300X, genel özelliklerde şu avantajları sağlıyor:
- 2.4 kat daha yüksek bellek kapasitesi
- 1.6 kat daha yüksek bellek bant genişliği
- 1.3 kat FP8 TFLOPS
- 1.3 kat FP16 TFLOPS
- Llama 2 70B, birebir kıyaslamada yüzde 20’ye kadar daha hızlı
- FlashAttention 2, birebir kıyaslamada yüzde 20’ye kadar daha hızlı
- Llama 2 70B, 8v8 sunucuda yüzde 40’a kadar daha hızlı
- FlashAttention 2, 8v8 sunucuda yüzde 60’a kadar daha hızlı
MI300X’in arkasındaki yazılım, ROCm 6.0, çeşitli yapay zeka iş yüklerini destekleyen yeni özellikler içeriyor. Zira bu yazılım, en yeni hesaplama formatlarını destekleyerek performansı artırıyor. MI300X, NVIDIA’nın Hopper ve Intel’in Gaudi yapay zeka hızlandırıcılarına karşı rekabeti artıracak. CDNA 3 mimarisine dayanan MI300X, toplamda 153 milyar transistöre sahip. Ayrıca MI300X’in bellek kapasitesi 192 GB (HBM3). Yani selefi MI250X’e göre yüzde 50 daha fazla.
AMD MI300X, güç tüketimi tarafında 750W TDP ile karşımıza çıkıyor. Ek olarak AMD, bu çipi destekleyen sistemleri sergilerken, 8 MI300X GPU hızlandırıcısı ve iki AMD EPYC 9004 CPU içeren bir konfigürasyonu paylaştı.
Son olarak, AMD’nin Instinct MI300 AI çiplerini destekleyeceğini açıklayan şirketler arasında Oracle, Dell, META ve OpenAI gibi büyük isimler bulunuyor. Şirketin yapay zeka alanında sadece bir alternatif olmak değil, lider olma hedefi olduğu için NVIDIA ve Intel gibi rakipleri için de ciddi bir rekabet ortamı yaratıyor.
GPU | AMD INSTINCT MI400 | AMD INSTINCT MI300X | AMD INSTINCT MI300A | AMD INSTINCT MI250X | AMD INSTINCT MI250 | AMD INSTINCT MI210 | AMD INSTINCT MI100 | AMD RADEON INSTINCT MI60 | AMD RADEON INSTINCT MI50 | AMD RADEON INSTINCT MI25 | AMD RADEON INSTINCT MI8 | AMD RADEON INSTINCT MI6 |
---|---|---|---|---|---|---|---|---|---|---|---|---|
CPU Mimarisi | Zen 5 (Exascale APU) | Yok | Zen 4 (Exascale APU) | Yok | Yok | Yok | Yok | Yok | Yok | Yok | Yok | Yok |
GPU Mimarisi | CDNA 4 | Su Vanjaramı (CDNA 3) | Su Vanjaramı (CDNA 3) | Aldebaran (CDNA 2) | Aldebaran (CDNA 2) | Aldebaran (CDNA 2) | Arkturus (CDNA 1) | Vega 20 | Vega 20 | Vega 10 | Fiji XT | Polaris10 |
GPU İşlem Düğümü | 4nm | 5nm+6nm | 5nm+6nm | 6nm | 6nm | 6nm | 7 nm FinFET | 7 nm FinFET | 7 nm FinFET | 14 nm FinFET | 28nm | 14 nm FinFET |
GPU Yongaları | henüz bilinmiyor | 8 (MCM) | 8 (MCM) | 2 (MCM) 1 (Kalıp Başına) | 2 (MCM) 1 (Kalıp Başına) | 2 (MCM) 1 (Kalıp Başına) | 1 (Monolitik) | 1 (Monolitik) | 1 (Monolitik) | 1 (Monolitik) | 1 (Monolitik) | 1 (Monolitik) |
GPU Çekirdekleri | henüz bilinmiyor | 19.456 | 14.592 | 14.080 | 13.312 | 6656 | 7680 | 4096 | 3840 | 4096 | 4096 | 2304 |
GPU Saat Hızı | henüz bilinmiyor | 2100 MHz | 2100 MHz | 1700 MHz | 1700 MHz | 1700 MHz | 1500 MHz | 1800 MHz | 1725MHz | 1500 MHz | 1000 MHz | 1237 MHz |
INT8 Hesaplama | henüz bilinmiyor | 2614 ÜST | 1961 ÜSTLERİ | 383 ÜST | 362 ÜST | 181 ÜST | 92.3 ÜSTLER | Yok | Yok | Yok | Yok | Yok |
FP16 Hesaplama | henüz bilinmiyor | 1.3 PFLOP’lar | 980,6 TFLOP | 383 TFLOP | 362 TFLOP | 181 TFLOP | 185 TFLOP | 29,5 TFLOP | 26,5 TFLOP | 24.6 TFLOP | 8.2 TFLOP’lar | 5.7 TFLOP’lar |
FP32 Hesaplama | henüz bilinmiyor | 163,4 TFLOP | 122,6 TFLOP | 95,7 TFLOP | 90,5 TFLOP | 45.3 TFLOP | 23.1 TFLOP’lar | 14.7 TFLOP’lar | 13.3 TFLOP’lar | 12.3 TFLOP’lar | 8.2 TFLOP’lar | 5.7 TFLOP’lar |
FP64 Hesaplama | henüz bilinmiyor | 81.7 TFLOP | 61.3 TFLOP | 47,9 TFLOP | 45.3 TFLOP | 22.6 TFLOP | 11.5 TFLOP | 7.4 TFLOP’lar | 6.6 TFLOP | 768 GFLOP | 512 GFLOP | 384 GFLOP |
VRAM | henüz bilinmiyor | 192 GB HBM3 | 128 GB HBM3 | 128 GB HBM2e | 128 GB HBM2e | 64 GB HBM2e | 32 GB HBM2 | 32 GB HBM2 | 16 GB HBM2 | 16 GB HBM2 | 4 GB HBM1 | 16 GB GDDR5 |
Infinity Önbelleği | henüz bilinmiyor | 256 MB | 256 MB | Yok | Yok | Yok | Yok | Yok | Yok | Yok | Yok | Yok |
Memory Clock | henüz bilinmiyor | 5,2 Gb/sn | 5,2 Gb/sn | 3,2 Gb/sn | 3,2 Gb/sn | 3,2 Gb/sn | 1200 MHz | 1000 MHz | 1000 MHz | 945 MHz | 500 MHz | 1750 MHz |
Bellek Veri Yolu | henüz bilinmiyor | 8192-bit | 8192-bit | 8192-bit | 8192-bit | 4096 bit | 4096 bit veri yolu | 4096 bit veri yolu | 4096 bit veri yolu | 2048 bit veri yolu | 4096 bit veri yolu | 256 bit veri yolu |
Bellek Bant Genişliği | henüz bilinmiyor | 5,3 TB/sn | 5,3 TB/sn | 3,2 TB/sn | 3,2 TB/sn | 1,6 TB/sn | 1,23 TB/sn | 1 TB/sn | 1 TB/sn | 484 GB/sn | 512 GB/sn | 224 GB/sn |
Soğutma | henüz bilinmiyor | Pasif Soğutma | Pasif Soğutma | Pasif Soğutma | Pasif Soğutma | Pasif Soğutma | Pasif Soğutma | Pasif Soğutma | Pasif Soğutma | Pasif Soğutma | Pasif Soğutma | Pasif Soğutma |
TDP (Maks.) | henüz bilinmiyor | 750W | 760W | 560W | 500W | 300W | 300W | 300W | 300W | 300W | 175W | 150W |
Başlığınız şaka mı? Nvidia daha hızlı deyip amd nin daha hızlı olduğu haberi veriyorsunuz
Başlık doğru okuma şeklin yanlış tekrar ve dikkatli oku karıştırılabilecek bir başlık yazılmış Nvidia rakibinden yani Nvidia nın rakibinden yüzde 60 daha hızlı bir şey çıktı anlamında
Okuyamaman şakamı sevgilimin sevgisi şakamı
Nvidia’nın cuda kütüphanesi gibi bir yazılım desteği sunmadıkları durumda bu donanımı hiç bir önemi yok
Gönderileri oluşturmadan başlıkları okuyor musunuz? Bu nasıl başlık la
Amd şu ana kadar bütün tanıtımlarında şöyle hızlı böyle hızlı dedi ama hiç biri tutmadı. Piyasaya çıksın o zaman görürüz zaten nvidia cevabı yapıştırır.
AMD ❤️