Teknolojinin hızla gelişmesiyle birlikte yapay zeka araçları da her alanda hayatımızda daha çok yer edinmeye başladı. Google, Microsoft, Facebook’un sahibi olan Meta ve OpenAI gibi dünyanın önde gelen teknoloji devleri, yapay zeka alanında yoğun bir şekilde çalışmalar yürütüyor. Peki yapay zeka araçları için en başarılı dil modeli hangi şirkete ait? Yapılan bir araştırma, bu soruya cevap verdi.

En başarılı dil modelleri, OpenAI’a ait!

Verilere geçmeden önce bilmeyenler için LLM ya da Türkçe adıyla Büyük Dil Modeli, doğal dil işleme alanında kullanılan yapay zeka sistemlerinden birisi. Büyük miktardaki metin ve veri ile eğitilerek dilin kullanımını ve bağlamını anlamayı öğrenirler. Yani örnek vermek gerekirse yapay zeka aracı ChatGPT‘nin verdiği yanıtlar, dil modeline bağlı. O halde en başarılı dil modellerine geçelim.

En başarılı dil modelleri, OpenAI'a ait!

Kasım 2023 itibariyle Simon Hughes adlı bir veri bilimcisi ve yapay zeka uzmanı tarafından hazırlanan rapor, en etkili LLM’lerin doğru bilgi sağlama konusunda ne kadar başarılı olduğunu gözler önüne serdi. Bu raporda OpenAI oldukça öne çıktı.

ChatGPT Plus üyelikleri durduruldu! İşte nedeni

ChatGPT Plus üyelikleri durduruldu! İşte nedeni

Dünyanın en çok kullanılan yapay zekâ modellerinden biri olan ChatGPT, ücretli ChatGPT Plus hizmetini durdurma kararı ile gündeme geldi.

Verilere göre OpenAI‘a ait GPT 4 dil modeli, yüzde 97 oranında doğru bilgi sağlıyor. Bu da yüzde 3 oranında halüsinasyon durumu yaşandığı yani bir bilgi uydurduğu anlamına geliyor. En başarılı ikinci dil modeli ise yine OpenAI tarafından geliştirilen GPT 4 Turbo. Bu da doğru bilgi sağlama konusunda GPT 4 ile aynı orana sahip. Bu iki dil modeline ücret ödeyerek erişilebildiğini belirtmekte fayda var.

Dil ModeliDoğru Bilgi Verme OranıYanlış Bilgi Verme OranıCevap Verebilme OranıOrtalama Yanıt Uzunluğu (Kelime)
GPT 4Yüzde 97Yüzde 3.0Yüzde 100.081.1
GPT 4 TurboYüzde 97Yüzde 3.0Yüzde 100.094.3
GPT 3.5 TurboYüzde 96.5Yüzde 3.5Yüzde 99.684.1
Llama 2 70BYüzde 94.9Yüzde 5.1Yüzde 99.984.9
Llama 2 7BYüzde 94.4Yüzde 5.6Yüzde 99.6119.9
Llama 2 13BYüzde 94.1Yüzde 5.9Yüzde 99.882.1
Cohere-ChatYüzde 92.5Yüzde 7.5Yüzde 98.074.4
CohereYüzde 91.5Yüzde 8.5Yüzde 99.859.8
Anthropic Claude 2Yüzde 91.5Yüzde 8.5Yüzde 99.387.5
Mistral 7BYüzde 90.6Yüzde 9.4Yüzde 98.796.1
Google Palm 2Yüzde 87.9Yüzde 12.1Yüzde 92.436.2
Google Palm 2 ChatYüzde 72.8Yüzde 27.2Yüzde 88.8221.1

Yukarıdan detaylıca inceleyebileceğiniz tablonun biraz aşağısına doğru göz kaydırdığımızda Google‘a ait Palm 2 dil modeli tarafından sağlanan bilgilerin yüzde 12.1‘inin uydurma olduğunu görüyoruz. Bu da doğruluk oranının yüzde 87.9 olduğu anlamına geliyor. Google Palm 2 dil modelinin yapay zeka aracı Google Bard‘a destek verdiğini belirtelim.