Google Cloud’un tamamen yönetilen ve birleşik geliştirme platformu olan Vertex AI, modellerden büyük ölçekte yararlanmak, kurumsal kullanıma hazır ayarlama, temelleme, izleme ve dağıtım yetenekleriyle modelleri özelleştirmek ve yapay zeka aracıları oluşturmak için kapsamlı bir çözüm sunuyor.
150’den fazla birinci taraf, açık kaynaklı ve üçüncü taraf temel model seçeneğiyle Vertex AI, ADT, IHG Hotels & Resorts, ING Bank ve Verizon gibi müşterilere yapay zeka uygulamaları ve aracıları oluşturma, dağıtma ve sürdürme için tek noktadan bir platform sağlayarak inovasyonu hızlandırıyor.
Google I/O 2024’te Vertex AI için önemli güncellemeler
Google I/O 2024’te, Google DeepMind ve Google’daki diğer ekipler tarafından geliştirilen ve Bulut müşterilerinin kullanımına sunulan yeni modellerin başını çektiği bir dizi Vertex AI güncellemesi duyuruldu:
Şimdi Kullanılabilir:
Gemini 1.5 Flash: Halka açık önizleme sürümünde bulunan Gemini 1.5 Flash, 1 milyon token’lık çığır açan bağlam penceresi sunarken, 1.5 Pro’dan daha hafif ve sohbet uygulamaları gibi görevler için hız ve ölçekle etkili bir şekilde hizmet vermek üzere tasarlandı.
PaliGemma: Vertex AI Model Garden’da bulunan PaliGemma, Gemma açık model ailesindeki ilk görme dili modeli ve resim altyazısı ve görsel soru cevaplama gibi görevler için ideal.
Yakında Geliyor:
Imagen 3: İnanılmaz düzeyde ayrıntı üretebilen ve fotogerçekçi, gerçeğe yakın görüntüler üretebilen, bugüne kadarki en yüksek kaliteli metinden görüntüye üretim modeli.
Gemma 2: Geniş bir yelpazede yapay zeka geliştirici kullanımı için tasarlanmış açık modeller ailesinin yeni nesli olan Gemma 2, Gemini’yi oluşturmak için kullanılan teknolojilerin aynısını kullanıyor.
Vertex AI’daki yeni özellikler
Google, müşterilerin model performansını optimize etmelerine yardımcı olmak için bağlam önbelleğe alma, kontrollü oluşturma ve toplu API gibi yeni özellikler de duyurdu.
Bağlam Önbelleğe Alma: Müşterilerin önbelleğe alınmış bağlam verilerini aktif olarak yönetmelerini ve yeniden kullanmalarını sağlayan bağlam önbelleğe alma, işlem maliyetlerini önemli ölçüde azaltmaya yardımcı oluyor.
Kontrollü Oluşturma: Müşterilerin Gemini model çıktılarını belirli formatlara veya şemalara göre tanımlamasını sağlayan kontrollü oluşturma, model çıktılarının biçimini ve sözdizimini garanti altına alıyor.
Toplu API: Sınıflandırma ve duyarlılık analizi, veri çıkarma ve açıklama oluşturma gibi kullanım durumlarını hedefleyen, gecikmeye duyarlı olmayan çok sayıda metin istemi isteği göndermenin süper verimli bir yolu olan toplu API, geliştirici iş akışlarını hızlandırmaya ve maliyetleri azaltmaya yardımcı oluyor.
Agent Builder: Yeni açık kaynak entegrasyonları
Vertex AI Agent Builder, geliştiricilerin doğal dil kullanarak yapay zeka aracıları oluşturmak için kodsuz bir konsoldan LangChain gibi kod öncelikli açık kaynaklı düzenleme çerçevelerine kadar bir dizi araç aracılığıyla yapay zeka deneyimleri oluşturmalarını ve dağıtmalarını sağlıyor. Google, Agent Builder’ı daha da güçlendirmek için Firebase Genkit’i ve LlamaIndex’i Vertex AI’da kullanıma sundu.
Firebase Genkit: Firebase tarafından duyurulan Genkit, üretime hazır yapay zeka aracılarının geliştirilmesini, dağıtılmasını ve izlenmesini basitleştirmek için tasarlanmış açık kaynaklı bir Typescript/JavaScript çerçevesi.
LlamaIndex on Vertex AI: Veri alımı ve dönüşümünden gömme, indeksleme, geri getirme ve üretime kadar erişim artırılmış üretim (RAG) sürecini basitleştiren LlamaIndex, özel veri kaynaklarını üretken modellere bağlamak için basit, esnek, açık kaynaklı bir veri çerçevesi sunuyor.
Google Search ile Temelleme
Google, müşterilerinin çıktılarını kendi özel veritabanlarında veya belirlenmiş “kurumsal doğruluk” kaynaklarında temellendirmelerine yardımcı olmanın yanı sıra, Google Arama ile Temelleme özelliğinin artık genel kullanıma sunulduğunu duyurdu. Ayrıca, üretilen çıktı tazminatı kapsamını genişleterek, Google Arama ile temellendirilen çıktıları Üretken Yapay Zeka tazminatlı hizmetleri kapsamına aldı.
Google, Vertex AI ile yapay zeka inovasyonunu demokratikleştirmeyi ve kuruluşların üretimde yapay zeka dağıtımlarını hızlandırmalarını desteklemeyi hedefliyor.
Etkinliği izlemek için aşağıdaki bağlantıyı tıklayabilirsiniz.