Çinli yapay zeka girişimi DeepSeek, 2026 yılına büyük bir teknik atılımla giriş yaptı. Şirket, büyük dil modellerinin eğitimini daha kararlı ve uygun maliyetli hale getirmek amacıyla geliştirdiği yeni bir derin öğrenme mimarisini duyurdu. Yayınlanan teknik makale, sektör gözlemcileri tarafından şirketin yakında piyasaya süreceği yeni büyük ürünün habercisi olarak değerlendiriliyor.
DeepSeek yeni mHC mimarisi ile yapay zeka eğitim maliyetlerini düşürüyor
Hangzhou merkezli firma tarafından paylaşılan makale, Manifold-Constrained Hyper-Connections (mHC) adı verilen yeni bir çerçeveyi tanıtıyor. Şirketin kurucusu Liang Wenfeng ve kıdemli araştırmacıların imzasını taşıyan bu çalışma, yapay sinir ağları büyüdükçe ortaya çıkan kararsızlık ve ölçeklenebilirlik sorunlarını çözmeyi hedefliyor. Araştırma ekibi, mHC mimarisinin mevcut yöntemlere kıyasla somut performans iyileştirmeleri ve üstün ölçeklenebilirlik sunduğunu belirtiyor.

Bu yeni sistem, ByteDance araştırmacılarının 2024 yılında modern dil modellerinin temeli olan ResNet’i geliştirmek için sunduğu hiper-bağlantı (hyper-connections) mimarisinin üzerine inşa ediliyor. ByteDance’in orijinal yaklaşımı sinyal akışını iyileştirse de, çok büyük modellerde bellek kullanımı sorunlarına yol açıyordu. DeepSeek ise bu bağlantıları belirli bir matematiksel manifold üzerine yansıtarak sinyallerin kaybolmasını veya aşırı büyümesini engelleyen özdeşlik eşlemesi (identity mapping) özelliğini sisteme geri kazandırıyor.
DeepSeek’in yeni modeli devlere meydan okuyor!
DeepSeek V3.2 yayınlandı. GPT-5 ve Gemini 3.0'a rakip olan açık kaynaklı model, düşük maliyeti ve yüksek performansıyla dikkat çekiyor.Geliştirilen mHC mimarisi; 3 milyar, 9 milyar ve 27 milyar parametreli modeller üzerinde test edildi. Elde edilen sonuçlar, sistemin bilgi işlem kapasitesi üzerinde büyük bir yük oluşturmadan etkili bir şekilde ölçeklenebildiğini kanıtladı. Bu verimlilik, özellikle yüksek maliyetli yapay zeka eğitim süreçlerinde şirketlere büyük bir avantaj sağlamayı vaat ediyor.

DeepSeek’in bu teknik paylaşımları, genellikle yeni ürün lansmanlarının bir ön işareti olarak görülüyor. Kurucu Liang Wenfeng’in makaleyi bizzat arXiv platformuna yüklemesi, geçmişteki başarılı model lansmanlarıyla benzerlik gösteriyor. Uzmanlar, şirketin geçen yılki R1 modelinde olduğu gibi, 17 Şubat’ta başlayacak olan Bahar Festivali’nden önce yeni bir büyük model tanıtabileceğini öngörüyor.
Xiaomi ve DeepSeek Hakkında Şok İddia!
ABD'de bazı kongre üyeleri, Xiaomi ve DeepSeek firmalarının Çin hükümetine destek sağladığını iddia etti.Kantitatif risk fonu High-Flyer’ın iştiraki olan DeepSeek, eğitim maliyetlerini düşüren teknik buluşlarıyla tanınıyor. ABD’li rakiplerine karşı daha düşük bütçelerle rekabetçi performans sergileyen şirket, Çin yapay zeka ekosistemindeki şeffaf ve paylaşımcı kültürü de temsil ediyor. Giderek artan bu akademik paylaşımlar, şirketin küresel yapay zeka yarışındaki konumunu güçlendiriyor.
Sizce DeepSeek’in maliyet odaklı bu yeni mimarisi, yapay zeka dünyasında dengeleri değiştirebilir mi? Bir sonraki büyük modelden beklentileriniz neler?
