Geliştiriciler için konuşma sentez teknolojileri geliştirmekte olan Montreal merkezli Lyrebird’ün yen, servisi, sadece 1 dakikalık sesten herhangi birinin sesini kopyalayabiliyor.
Lyrebird’ün teknolojisi tartışma yaratacak!
1 dakikalık ses kaydı sonrasında kişinin ses DNA’sını eşsiz bir anahtar halinde sıkıştıran API, bu anahtarı kullanarak ilgili sesten herhangi bir konuşma oluşturulabilmesini sağlıyor. Şirket, konuşmacının oluşturacağı ses için kullanacağı kelimeleri söyletmesine veya farklı tonlamalar yapmaya ihtiyaç duymayacağını ifade ediyor. Oluşturulan seste kızgınlık, sempati, stres gibi duyguların kontrol edilmesi olanağı da sunuluyor.
Lyrebird tarafından geliştirilen API’nin sunulan bazı ses örnekleri şimdiden oldukça ikna edici gözüküyor. Örneğin altta göreceğiniz örnekte, ABD Başkanı Donald Trump’ı dinleyebilirsiniz.
Adobe geçtiğimiz Kasım ayında Project VoCo adıyla benzer bir teknolojiye dair tanıtım yapmıştı. Öte yandan bu proje 20 dakikalık sese ve konuşma sentezi için sistem kaynaklarına ihtiyaç duyuyor. Lyrebird API’si ise bulut tabanlı olmasıyla da fark yaratıyor. Şirketin GPU kümesi, 1000 cümleyi yarım saniyeden daha az sürede oluşturabiliyor.
[soundcloud url=”https://api.soundcloud.com/tracks/319146798″ params=”auto_play=false&hide_related=false&show_comments=true&show_user=true&show_reposts=false&visual=true” width=”100%” height=”450″ iframe=”true” /]
Lyrebird tarafından geliştirilen servis haliyle tartışmaları da beraberinde getirecek cinsten ve şirket de bunun farkında. Öte yandan şirket bu teknolojiyi herkese açarak, insanların bu tarz teknolojilerin varlığından haberdar olacağını ve buna göre her ses kaydına inanmayacağı görüşünde. Yani istenilen bu durumu, insanların her fotoğrafın gerçek olduğuna inanmayıp “Photoshop’tur!” demesine benzetebiliriz. Öte yandan tabii ki yine de teknolojinin birçok riski mevcut.
Bakalım Lyrebird tarafından herkese açılacak bu teknoloji sonrasında çeşitli güvenlik ve gizlilik sorunları ortaya çıkmaya başlayacak mı?
:: Ses kopyalama teknolojisi konusunda ne düşünüyorsunuz?
Bunu seneler önce Kurtlar Vadisinde masonlar kullanmıştı
buna benzer teknolojiler hep vardı zaten… ama her zaman tespit edilebilirler… yani kopyalansa da gerekli inceleme ile kopya oldukları anlaşılır…
AYNEN
Benim kuzenimin oyuncağı var bebek, aynısını o da yapıyor gıdıklama beni falan diyor sizi sesinizle güzel bi oyuncak yani bunar daha hiç bir şey hem aynısı kurtlar vadisinde de olmuştu
Bu teknoloji cok uzun zamandan beri var idi zaten.
Hatta bir videonun konusmacisinin bile soylediklerini degistirebiliyorsun. Dudaklarini da ona gore degistirebiliyorsun. Vardi evvelden beri.