Instagram Facebook Threads ve WhatsApp’ı kendi çatısı altında toplayan Meta yapay zeka dünyasında yaptığı güncellemeler ile dikkatleri üstüne çekiyor. Meta, yeni yapay zeka paketiyle konuşma çevirisini daha kusursuz ve etkileyici hale getiriyor. Artık fısıltıları bile çevirebiliyor. İşte detaylar…

Meta’nın yeni yapay zekası, konuşma çevirisini daha kusursuz hale getiriyor!

Ağustos ayında Meta, metin için yaklaşık 100 dili ve konuşma için 36 dili destekleyen yapay zeka çeviri modeli SeamlessM4T’yi tanıttı. Ancak Meta bununla yetinmiyor. Daha geliştirmek için algoritmanın mimarisini güncelledi. Güncellenmiş mimarisiyle bu algoritma, konuşma çevirilerini daha spontane ve anlamlı hale getirecek. Bunun için teknoloji devi Meta şimdi bu araca 2 yeni özellik ekledi.

İki yeni özellikten ilki, adından da anlaşılabileceği gibi ifadelerinizi çevrilmiş konuşmanıza aktarıyor. Meta bu özelliğe Sorunsuz İfade Edici adını verdi. Bu özellik ile algoritma, ses tonunuzu, duygusal tonunuzu ve fısıltılarınızı, konuşma hızınızı da çevirecek.

Meta, X, TikTok, Snapchat ve Discord mahkemeye çıkıyor!

Meta, X, TikTok, Snapchat ve Discord mahkemeye çıkıyor!

Sosyal medya devleri Meta, X, TikTok, Snap ve Discord'un CEO'ları ABD Senatosu önünde ifade verecek. İşte detaylar..

Şimdiye kadar çevrilen konuşmalar, kulağa hep robotik geliyor. Bu özelliğin hem günlük yaşamlarımızda hem de içerik üretiminde potansiyel olarak ezber bozan bir gelişme olduğunu söyleyebiliriz. Ayrıca bu özellik birkaç dil tarafından destekleniyor. Bu diller arasında İngilizce, İspanyolca, Almanca, Fransızca, İtalyanca var. Hatta Çince bile mevcut.

İkinci özellik ise, konuşmacı hala konuşurken bir konuşmayı tercüme etmeye başlıyor. Böylece diğerlerinin tercümeyi daha hızlı duymasını sağlıyor. Meta bu özelliğe Kesintisiz Akış ismini verdi. Ne yazık ki bu özelliğin bazı handikapları var. Hala iki saniyenin biraz altında olsa da çeviri esnasında kısa bir gecikme yaşanıyor. Ancak çeviriyi dinlemek için birinin cümlesini bitirmesini beklemek zorunda kalmayacaksınız. 

Meta’ya göre buradaki zorluk, farklı dillerin farklı cümle yapılarına sahip olmasından kaynaklanıyor. Dolayısıyla çevrilmiş bir çıktı oluşturmaya başlamak için yeterli bağlamın olup olmadığına veya dinlemeye devam edilip edilmeyeceğine karar vermek gerekiyor. Bunun için teknoloji devi, kısmi ses girdisini incelemeye adanmış bir algoritma geliştirmek zorundaydı.

Meta’nın kusursuz iletişim paketindeki son gelişimi rakiplerini geride bırakıyor. Ayrıca Google ve Samsung gibi şirketlerin sunduğu mobil tercüman araçlarından daha etkileyici görünüyor. Halkın bu yeni özellikleri ne zaman kullanabileceğine dair bir bilgi yok. Ancak uzmanlar, Meta’nın bu özellikleri arttırılmış gerçeklik gözlüklerine dahil edeceğini tahmin ediyor.