Çinli e-ticaret devi Alibaba Group Holding‘in modeli “AliceMind”, 2021 küresel Görsel Soru Yanıtlama (VQA) Yarışmasında en üst sırayı aldıktan sonra bir makine, metin sorularını yanıtlamak için ilk kez görüntüleri anlamada insanlardan daha iyi performans gösterdi.
Alibaba‘dan Perşembe günü yapılan açıklamaya göre; Alibaba‘nın algoritması, 2015’ten beri Bilgisayarla Görme ve Örüntü Tanıma Konferansı (CVPR) tarafından yürütülen yıllık Görsel Soru Yanıtlama yarışmasında insanlar için yüzde 80,83‘lük bir doğruluk oranına kıyasla, görüntülerle ilgili soruları yanıtlarken yüzde 81,26 doğruluk oranı kaydetti.
Bu yıl yarışmada 250.000‘den fazla resim ve 1,1 milyon soru içeriyordu. Değerlendirme, katılımcılardan doğru bir yanıt vermelerinin istendiği bir resim ve ilgili bir soru sunar. Hangzhou merkezli şirket, Alibaba’nın sekiz gün önce güncellenen sonucunun ABD teknoloji devi Microsoft da dahil olmak üzere diğer küresel oyuncuları yendiğini söyledi.
Alibaba DAMO Academy’de Doğal Dil İşleme (NLP) başkanı Si Luo, “İlgili yapay zeka alanlarında araştırma ve geliştirmeyi sürdürme konusundaki sürekli çabalarımızın altını çizen makine zekasında önemli bir dönüm noktasına ulaştığımız için gurur duyuyoruz” dedi. “Bu, bir gün insanların yerini robotların alacağı anlamına gelmiyor. Bunun yerine, günlük işlerimize ve yaşamımıza yardımcı olmak için daha akıllı makinelerin kullanılabileceğinden ve dolayısıyla insanların en iyi oldukları yaratıcı görevlere odaklanabileceklerinden eminiz.”
Bilgisayarla görü, Çin’deki en aktif yapay zeka araştırma ve geliştirme alanlarından biridir ancak gözetim uygulamalarına ve ABD-Çin teknoloji savaşının etkisine yapılan erken vurgu, yeni ticari büyüme faktörleri arayışına yol açmıştır.
Alibaba, her gün Alibaba’nın perakende platformlarında on binlerce tüccar tarafından kullanılan akıllı sohbet robotu Alime Shop Assistant da dahil olmak üzere, Görsel Soru Yanıtlama yarışmasında birçok uygulama senaryosunda zaten kullandı.
{{user}} {{datetime}}
{{text}}