Ünlü iş insanı Elon Musk tarafından Mart 2023’te kurulan xAI şirketi, Grok adlı sohbet botu için Grok Grok-1.5 modelini duyurdu. İlk sürüme kıyasla oldukça gelişmiş olduğu paylaşılan bu modelin OpenAI tarafından geliştirilen GPT-4‘ten de daha performanslı olduğu söyleniyor. İşte Grok-1.5 modeli ile ilgili ayrıntılar…

xAI, resmi web sitesi üzerinden Grok-1.5 modelini duyurdu. Şirket tarafından paylaşılan bilgilere göre yeni model, artık belgeler, diyagramlar, çizelgeler, ekran görüntüleri ve fotoğraflar da dahil olmak üzere görsel işleyebiliyor.

Grok-1.5 modeli, GPT-4'ü geride bırakıyor!

Çok yönlü modlu modeller ile rekabet edebildiği belirtilen Grok-1.5 ile ilgili paylaşılan örneklere baktığımızda modelin tabloyu CSV’ye dönüştürme, koddaki hatayı çözme, diyagramı kodu dönüştürme ve meme açıklama gibi yetenekleriyle öne çıktığını görüyoruz.

X (Twitter)’te yeni dönem! ChatGPT rakibi Grok için sevindiren açıklama

X (Twitter)’te yeni dönem! ChatGPT rakibi Grok için sevindiren açıklama

Elon Musk tarafından duyurulan Grok, tüm Premium kullanıcılarının kullanımına sunulacak. İşte Grok AI özellikleri ve X Premium fiyatı...

Grok-1.5, xAI tarafından gerçekleştirilen MMMU testlerinde yüzde 53.6 oranında başarı elde etti. Karşılaştırma yapacak olursak, GPT-4 aynı testlerde yüzde 56.8 başarı sağladı. Ancak matematikle ilgili testlerde Grok-1.5, yüzde 52.8‘lik bir başarı elde ederek GPT-4‘ü geride bıraktı. Ayrıca xAI‘ın yeni modeli AI2D, metin okuma ve anlama ile gerçek dünya anlayışı testlerinde de rakiplerini zorladı.

Grok-1.5 ve rakip modellerin Benchmark sonuçları şu şekilde;

BenchmarkGrok-1.5VGPT-4VClaude 3 SonnetClaude 3 OpusGemini Pro 1.5
MMMU (Çok Disiplinli)53.6%56.8%53.1%59.4%58.5%
Matematik52.8%49.9%47.9%50.5%52.1%
AI2D88.3%78.2%88.7%88.1%80.3%
Metin okuma78.1%78.0%73.5%
ChartQA76.1%78.5%81.1%80.8%81.3%
Belgeler85.6%88.4%89.5%89.3%86.5%
Gerçek Dünya Anlayışı68.7%61.4%51.9%49.8%67.5%

xAI, Grok-1.5 modelini yakın zamanda kullanıcılar ile test etmeye başlayacağını ve X‘teki Grok sohbet botuna entegre edeceğini açıkladı. Bilmeyenler için bu bota erişebilmek için X Premium abonesi olmak gerekiyor.

Peki siz bu konu hakkında neler düşünüyorsunuz? Grok-1.5 modelinin yeteneklerini ve Benchmark sonuçlarını nasıl buldunuz? Görüşlerinizi aşağıdaki Yorumlar kısmından bizimle paylaşabilirsiniz.