Son dönemlerde yapay zeka alanında önemli gelişmeler yaşanıyor. Geçtiğimiz aylarda OpenAI, yapay zeka aracı ChatGPT’yi kullanıma sundu. Bu adım, bu alanda resmen bir yarış başlattı. Microsoft ve Google gibi teknoloji devleri bu yarışa dahil olmak için çalışmalar yürütüyor. Son olarak Google, OpenAI’ın dil modeli GPT’ye rakip olan Gemini’ı tanıttı. Peki Google Gemini özellikleri neler? GPT 4’e göre ne gibi farkları var? İşte tüm detaylar…

Google Gemini özellikleri

Google’ın kısa süre önce gerçekleştirdiği etkinlikte tanıttığı Gemini, geniş kullanım yelpazesinde hizmet verecek. Bu kapsamda dil modelinin üç farklı versiyon bulunuyor. Bunlar sırasıyla Gemini Ultra, Gemini Pro ve Gemini Nano.

Google Gemini özellikleri

En hafif versiyon olan Gemini Nano, Android cihazlarda çalıştırılmak üzere sunuldu. Gemini Pro, Google Bard da dahil olmak üzere şirketin yapay zeka araçlarına güç verecekken, aralarından en büyüğü olan Gemini Ultra ise veri merkezi ve kurumsal uygulamalar için tasarlandı.

Öğrenciler yaşadı! Microsoft’un yapay zekası Copilot, GPT-4 Turbo ile gelişiyor!

Öğrenciler yaşadı! Microsoft’un yapay zekası Copilot, GPT-4 Turbo ile gelişiyor!

Yapay zeka sohbet robotu Microsoft Copilot, artık GPT-4 Turbo ve DALL-E 3 ile koordine bir şekilde çalışacak. İşte detaylar...

Google CEO’su Sundar Pichai ve Kurucu Ortağı Demis Hassabis liderliğindeki Google DeepMind ekibi tarafından geliştirilen Gemini, özellikle metin, ses, görüntü, video ve yazılım kodu gibi farklı türlerde verileri işleyebiliyor. Python, Java, C++ ve Go gibi dünyanın en popüler programlama dillerinde yazılan kodları anlayabiliyor ve baştan yazabiliyor.

Google Bard için kullanılmaya başlandı!

Google’ın bundan birkaç ay önce ChatGPT rakibi olarak kullanıma sunduğu Google Bard, şimdiye kadar LaMDA dil modeline dayanıyordu. Teknoloji devi, yapay zeka aracının bundan böyle Gemini Pro ile destekleneceğini duyurdu ve bu değişiklik herkes için sunuldu.

Google Gemini özellikleri

Google Tensor İşleme Birimleri ile eğitildi

Google Tensor İşleme Birimleri (TPU’lar), Gemini’ın ilk sürümünü eğitmek için kullanıldı. Teknoloji devi, bununla diğer yapay zeka araçlarını da eğitti. Google Tensor İşleme Birimleri, diğer yapay zeka şirketleri tarafından da tercih ediliyor.

GPT-4’ten daha mı iyi?

Google Gemini, dil modelleri için 32 akademik kriterin 30’unu karşılıyor. Gemini Ultra, yüzde 90 puanla matematik, fizik, tarih, hukuk, tıp ve etik gibi 57 konuda MMLU (büyük çoklu görev dil anlayışı) konusunda insan uzmanlardan bile daha iyi performans sergileyen ilk dil modeli oldu. Bu bağlamda GPT-4’ten daha iyi bir konumda.

Gemini Ultra ve GPT-4’ün Beceri Performansı Karşılaştırması;

Beceri – Başarı OranıGemini UltraGPT-4
Genel:Yüzde 90,0Yüzde 86,4
Muhakeme:Yüzde 83,6Yüzde 83,1
Okuma Anlayışı:Yüzde 82,4Yüzde 80,9
Sağduyulu Muhakeme:Yüzde 87,8Yüzde 95,3
Temel Aritmetik İşlemler:Yüzde 94,4Yüzde 92,0
Zorlu Matematik Problemleri:Yüzde 53,2Yüzde 52,9
Python Kodu Üretimi:Yüzde 74,4Yüzde 67,0

Gemini ve GPT-4V’nin Çoklu Modül Yetenekleri Performansı Karşılaştırması;

Yetenek – Başarı OranıAçıklamaGeminiOpenAI GPT-4V
Resim:Çok disiplinli kolej seviyesinde akıl yürütme sorunlarıYüzde 59.4Yüzde 56.8
VQAv2:Doğal görüntü anlamaYüzde 77.8Yüzde 77.2
TextVQA:Doğal görüntülerde OCRYüzde 82.3Yüzde 78.0
DocVQA:Belge anlamaYüzde 90.9Yüzde 88.4
Infographic VQA:Infografik anlamaYüzde 80.3Yüzde 75.1
MathVista:Görsel bağlamlarda matematiksel akıl yürütmeYüzde 53.0Yüzde 49.9
VATEX:İngilizce video altyazılama (CIDER)Yüzde 62.7Yüzde 56.0
Perception Test MCQA:Video soru cevaplamaYüzde 54.7Yüzde 46.3
COVOST 2 (21 dil):Otomatik konuşma çevirisi (BLEU puanı)Yüzde 40.1Yüzde 29.1
FLEURS (62 dil):Otomatik konuşma tanıma (kelime hata oranı temelinde, daha düşük daha iyi)Yüzde 7.6Yüzde 17.6

Google ve Alphabet CEO’su Sundar Pichai’nin açıklaması şu şekilde;

Her teknoloji değişimi, bilimsel keşfi ilerletme, insan ilerlemesini hızlandırma ve yaşamı iyileştirme fırsatıdır. Şu anda yapay zeka ile gördüğümüz geçiş, mobil veya önceki web’e geçişten çok daha büyük olacak ve benim yaşamımızda gördüğümüz en derin olacak.

Yapay zeka, her yerde insanlar için gündelikten olağanüstüye kadar fırsatlar yaratabilir. Yeni inovasyon ve ekonomik ilerleme dalgalarını getirecek ve bilgi, öğrenme, yaratıcılık ve üretkenliği daha önce görülmemiş bir ölçekte tetikleyecektir. Beni heyecanlandıran da işte bu: yapay zekayı herkes için dünyanın her yerinde yardımcı yapma şansı.

Sekiz yıla yaklaşan yapay zeka odaklı bir şirket olarak ilerlemenin hızı sadece artıyor: Şu anda milyonlarca insan, ürünlerimizde genaratif yapay zekayı kullanarak, bir yıl önce dahi yapamayacakları şeyleri yapabiliyor; daha karmaşık sorulara cevap bulmaktan yeni araçlarla işbirliği yapmaya ve oluşturmaya kadar.

Aynı zamanda, geliştiriciler, modellerimizi ve altyapımızı kullanarak yeni genaratif yapay zeka uygulamaları inşa ediyorlar ve dünya genelindeki start-up’lar ve şirketler, yapay zeka araçlarımızla büyüyorlar. Bu inanılmaz bir ivme, ancak sadece mümkün olanın yüzeyine çıkmaya başlıyoruz.

Bu çalışmaya cesurca ve sorumlulukla yaklaşıyoruz. Bu, araştırmamızda iddialı olmayı ve insanlara ve topluma büyük faydalar sağlayacak yetenekleri peşinde koşarken, yapay zeka daha yetenekli hale geldikçe riskleri ele almak için hükümetlerle ve uzmanlarla işbirliği yapmayı içerir.

En iyi araçlara, temel modellere ve altyapıya yatırım yapmaya devam ediyoruz ve bu ilkelere rehberlik ederek bunları ürünlerimize ve diğerlerine getiriyoruz. Şimdi, Gemini ile yolculuğumuza bir sonraki adımı atıyoruz, en yetenekli ve genel modelimiz, birçok önde gelen ölçekte üstün performans sunan bir model.

Yapay zeka, hayatımın çalışmasının odak noktası oldu, birçok araştırma arkadaşım gibi. Bilgisayar oyunları için yapay zeka programlamaya genç yaşta başladığımdan beri ve beyinin çalışma şeklini anlamaya çalışan bir nörobilim araştırmacısı olarak yıllarca, daha akıllı makineler inşa edebilirsek, onları insanlık yararına kullanabileceğimize inandım.

Bu, Google DeepMind’deki çalışmalarımızı yönlendirmeye devam eden sorumlulukla dolu bir yapay zeka tarafından sorumlu bir dünya vaadi. Uzun süredir, insanların dünyayı anlama ve etkileşim kurma biçiminden esinlenmiş yeni bir nesil yapay zeka modelleri inşa etmek istedik.

Yazılımın zeki bir parçası gibi değil, daha çok kullanışlı ve sezgisel bir şey gibi hissettiren bir yapay zeka – bir uzman yardımcı veya asistan. Bugün, bu vizyona bir adım daha yaklaşıyoruz ve inşa ettiğimiz en yetenekli ve genel modeli olan Gemini’yi tanıtıyoruz.

Gemini, Google’daki farklı ekipler arasındaki büyük çaplı işbirliği çabalarının bir sonucudur, bu arada Google Research’teki meslektaşlarımız da dahil. Farklı türlerdeki bilgileri, metin, kod, ses, görüntü ve video dahil olmak üzere farklı bilgi türlerini genelleme ve sorunsuz bir şekilde anlama, çalıştırma ve birleştirme yeteneği olan multimodal bir yapay zeka olarak temellendirildi.

Gemini aynı zamanda en esnek modelimizdir, veri merkezlerinden mobil cihazlara kadar her şeyde verimli bir şekilde çalışabilir. State-of-the-art yetenekleri, geliştiricilerin ve kurumsal müşterilerin yapay zeka ile nasıl inşa edip ölçeklendirdiklerini önemli ölçüde artıracaktır.

Sundar Pichai