Yapay zeka alanında sürekli gelişmeler yaşanırken Anthropic, yapay zeka modellerini daha yetenekli hale getirme yolunda önemli bir adım attı. Buna göre şirket, Claude 3.5 Sonnet başta olmak üzere Claude ailesindeki modellerini güncelledi.
Yenilenen Claude 3.5 Sonnet neler sunuyor?
Anthropic, Claude modellerinde önemli güncellemeler paylaşarak daha yetenekli bir yapay zeka sunmayı hedefliyor. Şirketin en güçlü Claude 3.5 Sonnet modeli, SWE-bench Verified kıyaslamasında yüzde 49.0 skor elde ederek bugüne kadarki en yüksek puana ulaştı. Bu da önceki Claude 3.5 Sonnet modelinin yüzde 33.4’lük skoruna göre önemli bir artış.
TAU-bench ve GPQA gibi diğer kıyaslamalarda da çift haneli yüzdelik puan artışları kaydedildi. Anthropic, güncellenmiş modelin bazı değerlendirmelerde Google Gemini 1.5 Pro gibi rakip modellerden daha iyi performans gösterdiğini de belirtti.
Anthropic ayrıca daha küçük ve daha uygun fiyatlı olan Claude 3.5 Haiku modelini erişime açtığını dile getirdi. Başlangıçta yalnızca metin tabanlı olmasına rağmen, önceki neslin en büyük modeli olan Claude 3 Opus’u yakalamayı başardı. Bu da GPT-3 Mini ve Gemini Flash gibi modellere alternatif hale getiriyor.
Yenilenen 3.5 Sonnet modeli; ABD ve Birleşik Krallık Yapay Zeka Güvenliği Enstitüleri (AISI) gibi kuruluşlarla iş birliği içinde test edildi. Anthropic, modelin çeşitli ölçeklendirme çerçevelerine ve ASL-2 güvenlik standartlarına uymaya devam ettiğini de belirtti.
Her iki Claude modeli de Anthropic API’si ve bulut entegrasyonları aracılığıyla aynı fiyatlarla sunulmaya devam edecek.