Geliştiriciler için konuşma sentez teknolojileri geliştirmekte olan Montreal merkezli Lyrebird’ün yen, servisi, sadece 1 dakikalık sesten herhangi birinin sesini kopyalayabiliyor.

İş ararken hacker tuzağına düşmeyin!

Lyrebird’ün teknolojisi tartışma yaratacak!

1 dakikalık ses kaydı sonrasında kişinin ses DNA’sını eşsiz bir anahtar halinde sıkıştıran API, bu anahtarı kullanarak ilgili sesten herhangi bir konuşma oluşturulabilmesini sağlıyor. Şirket, konuşmacının oluşturacağı ses için kullanacağı kelimeleri söyletmesine veya farklı tonlamalar yapmaya ihtiyaç duymayacağını ifade ediyor. Oluşturulan seste kızgınlık, sempati, stres gibi duyguların kontrol edilmesi olanağı da sunuluyor.

17-04/24/ses-kopyalama-02.jpg

Lyrebird tarafından geliştirilen API’nin sunulan bazı ses örnekleri şimdiden oldukça ikna edici gözüküyor. Örneğin altta göreceğiniz örnekte, ABD Başkanı Donald Trump’ı dinleyebilirsiniz.

Adobe geçtiğimiz Kasım ayında Project VoCo adıyla benzer bir teknolojiye dair tanıtım yapmıştı. Öte yandan bu proje 20 dakikalık sese ve konuşma sentezi için sistem kaynaklarına ihtiyaç duyuyor. Lyrebird API’si ise bulut tabanlı olmasıyla da fark yaratıyor. Şirketin GPU kümesi, 1000 cümleyi yarım saniyeden daha az sürede oluşturabiliyor.

[soundcloud url=”https://api.soundcloud.com/tracks/319146798″ params=”auto_play=false&hide_related=false&show_comments=true&show_user=true&show_reposts=false&visual=true” width=”100%” height=”450″ iframe=”true” /]

Lyrebird tarafından geliştirilen servis haliyle tartışmaları da beraberinde getirecek cinsten ve şirket de bunun farkında. Öte yandan şirket bu teknolojiyi herkese açarak, insanların bu tarz teknolojilerin varlığından haberdar olacağını ve buna göre her ses kaydına inanmayacağı görüşünde. Yani istenilen bu durumu, insanların her fotoğrafın gerçek olduğuna inanmayıp “Photoshop’tur!” demesine benzetebiliriz. Öte yandan tabii ki yine de teknolojinin birçok riski mevcut.

Bakalım Lyrebird tarafından herkese açılacak bu teknoloji sonrasında çeşitli güvenlik ve gizlilik sorunları ortaya çıkmaya başlayacak mı?

:: Ses kopyalama teknolojisi konusunda ne düşünüyorsunuz?