Corona virüsü pandemisi nedeniyle ülkeler tecrit halindeyken evlerinde zaman geçiren insanlar, çevresi ile iletişim kurmak için video-mesaj platformlarını daha sık kullanıyor. Durum böyle olunca internet trafiği artıyor ve bazı görüşmelerde aksamalar yaşanabiliyor.
WaveNetEQ teknolojisi zayıf internet bağlantısında konuşmanıza olanak tanıyacak
Google, kötü bağlantılardan kaynaklanarak oluşan ses boşluklarını doldurmak için yapay zeka desteğinden faydalanarak düşük kaliteli video görüşmelerini sonlandırmayı umuyor. WaveNetEQ olarak adlandırılan bu teknoloji, kesintili bir internet bağlantısının neden olduğu boşlukları doldurarak çalışıyor. Google, yapay zekasını (AI) çoğunlukla hece sesleri üretmek için eğitti. Geliştirilen yapay zeka 120 milisaniyeye kadar oluşan boşlukları doldurabiliyor.
Teknoloji şimdilik şirketin görüntülü sohbet telefonu uygulaması olan Google Duo ile sınırlı. Gizliliği ve Duo’nun uçtan uca şifrelemesini korumak için WaveNetEQ, video görüşmesindeki her katılımcının akıllı telefonları tarafından destekleniyor. Bu nedenle kullanıcıların hiçbir verisi Google ile paylaşılmıyor.
48 farklı dilde eğitildi
Bir sözcükten daha fazlası kaybolursa, çağrı sesi geri gelene kadar sessizlik oluşuyor. Çünkü yapay zeka teknolojisi henüz tüm kelimeleri algılayamıyor. Ancak teknoloji, konuşma sesini daha doğal hale getirmeye yardımcı olabilir. Bunun yanı sıra zayıf bir internet bağlantısında kaybedilen saniye kesirlerini geri yükleyebilir.
Teknoloji metin-konuşma modeline dayanıyor. Böylece “Ne söylenir” konusunda eğitilmenin yanı sıra, “Nasıl söylenir” konusunda da eğitilmiş durumda. Teknoloji önümüzdeki yıllarda sesleri tahmin etmek için güçlü bir fonetik anlayışına sahip olabilir.
Google, Duo video görüşmelerinin yüzde 99’unun sesle ilgili sorunlardan muzdarip olduğunu kabul ediyor. Bunlardan yüzde 20’si seslerin yüzde üçünden fazlasını kaybediyor. Yani WaveNetEQ teknolojisinin pek çok sorunun üstesinden gelebilir.
Google, sistemi 48 farklı dilde 100’den fazla hoparlör ile eğitti. Teknoloji devi konuyla ilgili olarak “Sistem, belirli bir dilin özellikleri yerine, insan konuşmasının genel özelliklerini öğreniyor. Telefonunuzdaki aramayı tren istasyonunda veya kafeteryada cevaplamak istediğinizde, WaveNetEQ’nun gürültülü ortamlarla başa çıkabilmesini sağlamak için, verileri çeşitli arka plan sesleriyle karıştırıyoruz.” açıklamalarında bulundu.
Google Pixel 4 akıllı telefon sahipleri, Aralık ayında bir yazılım güncellemesi yoluyla bu teknolojiyi alan ilk kişiler. Google şimdilik bunu söylememiş olsa da, artık daha fazla Android cihaza sunuluyor.