Reklam

Google, beklentileri düşürdü: En doğru bilgi veren dil modeli belli oldu!

Emir

16 Kasım 2023

Ana sayfa /

Teknolojinin hızla gelişmesiyle birlikte yapay zeka araçları da her alanda hayatımızda daha çok yer edinmeye başladı. Google, Microsoft, Facebook’un sahibi olan Meta ve OpenAI gibi dünyanın önde gelen teknoloji devleri, yapay zeka alanında yoğun bir şekilde çalışmalar yürütüyor. Peki yapay zeka araçları için en başarılı dil modeli hangi şirkete ait? Yapılan bir araştırma, bu soruya cevap verdi.

En başarılı dil modelleri, OpenAI’a ait!

Verilere geçmeden önce bilmeyenler için LLM ya da Türkçe adıyla Büyük Dil Modeli, doğal dil işleme alanında kullanılan yapay zeka sistemlerinden birisi. Büyük miktardaki metin ve veri ile eğitilerek dilin kullanımını ve bağlamını anlamayı öğrenirler. Yani örnek vermek gerekirse yapay zeka aracı ChatGPT‘nin verdiği yanıtlar, dil modeline bağlı. O halde en başarılı dil modellerine geçelim.

Kasım 2023 itibariyle Simon Hughes adlı bir veri bilimcisi ve yapay zeka uzmanı tarafından hazırlanan rapor, en etkili LLM’lerin doğru bilgi sağlama konusunda ne kadar başarılı olduğunu gözler önüne serdi. Bu raporda OpenAI oldukça öne çıktı.

Reklam

ChatGPT Plus üyelikleri durduruldu! İşte nedeni

Dünyanın en çok kullanılan yapay zekâ modellerinden biri olan ChatGPT, ücretli ChatGPT Plus hizmetini durdurma kararı ile gündeme geldi.

Verilere göre OpenAI‘a ait GPT 4 dil modeli, yüzde 97 oranında doğru bilgi sağlıyor. Bu da yüzde 3 oranında halüsinasyon durumu yaşandığı yani bir bilgi uydurduğu anlamına geliyor. En başarılı ikinci dil modeli ise yine OpenAI tarafından geliştirilen GPT 4 Turbo. Bu da doğru bilgi sağlama konusunda GPT 4 ile aynı orana sahip. Bu iki dil modeline ücret ödeyerek erişilebildiğini belirtmekte fayda var.

Dil Modeli	Doğru Bilgi Verme Oranı	Yanlış Bilgi Verme Oranı	Cevap Verebilme Oranı	Ortalama Yanıt Uzunluğu (Kelime)
GPT 4	Yüzde 97	Yüzde 3.0	Yüzde 100.0	81.1
GPT 4 Turbo	Yüzde 97	Yüzde 3.0	Yüzde 100.0	94.3
GPT 3.5 Turbo	Yüzde 96.5	Yüzde 3.5	Yüzde 99.6	84.1
Llama 2 70B	Yüzde 94.9	Yüzde 5.1	Yüzde 99.9	84.9
Llama 2 7B	Yüzde 94.4	Yüzde 5.6	Yüzde 99.6	119.9
Llama 2 13B	Yüzde 94.1	Yüzde 5.9	Yüzde 99.8	82.1
Cohere-Chat	Yüzde 92.5	Yüzde 7.5	Yüzde 98.0	74.4
Cohere	Yüzde 91.5	Yüzde 8.5	Yüzde 99.8	59.8
Anthropic Claude 2	Yüzde 91.5	Yüzde 8.5	Yüzde 99.3	87.5
Mistral 7B	Yüzde 90.6	Yüzde 9.4	Yüzde 98.7	96.1
Google Palm 2	Yüzde 87.9	Yüzde 12.1	Yüzde 92.4	36.2
Google Palm 2 Chat	Yüzde 72.8	Yüzde 27.2	Yüzde 88.8	221.1

Yukarıdan detaylıca inceleyebileceğiniz tablonun biraz aşağısına doğru göz kaydırdığımızda Google‘a ait Palm 2 dil modeli tarafından sağlanan bilgilerin yüzde 12.1‘inin uydurma olduğunu görüyoruz. Bu da doğruluk oranının yüzde 87.9 olduğu anlamına geliyor. Google Palm 2 dil modelinin yapay zeka aracı Google Bard‘a destek verdiğini belirtelim.

Reklam

Yorum Ekleyin

Reklam