Meta, çeşitli tarzlarda ikna edici konuşmalar üretebileceğini söylediği, yeni yapay zeka sistemi Voicebox'ı tanıttı. Sistem iki saniyelik konuşmadan gerçekci bir ses oluşturmak için kullanılabilir. Ancak şirket, modelin 'piyasaya sürülemeyecek kadar büyük riskler' barındırdığını söyledi.
Facebook ve Instagram'ın çatı şirketi Meta, yeni üretken yapay zeka modelini duyurdu.
Voicebox, özel olarak eğitilmediği halde ses düzenleme, örnekleme ve stil oluşturma gibi konuşma oluşturma görevlerini yerine getirme becerisiyle içerik oluşturuculara yardımcı olmak için tasarlandı.
Bu, yalnızca iki saniyelik konuşmadan gerçekçi bir ses oluşturmak için kullanılabilir, örneğin, potansiyel olarak konuşamayan insanlara ses getirmek veya insanların seslerini oyunlara eklemek için kullanılabilir.
Meta, aynı dili konuşmasalar bile insanların birbirleriyle otantik bir şekilde konuşmalarına izin vererek, bir konuşma pasajını bir dilden diğerine stili koruyacak şekilde çevirmek için de kullanılabileceğini söyledi.
Şirket, duyurusunda Voicebox'ın rakiplerinden çok daha etkili olduğunu iddia etti.
Örneğin, rakip Vall-E'nin yüzde 5,9'una kıyasla yüzde 1,9 hata oranıyla sözcükler üretebiliyor ve bunu 20 kata kadar daha hızlı yapıyor.
Meta, Voicebox'ın İngilizce, Fransızca, İspanyolca, Almanca, Lehçe ve Portekizce dillerinde halka açık sesli kitaplardan gelen 50 bin saatlik konuşma ve transkriptlerle eğitildiğini söyledi.
Model piyasaya sürülemeyecek kadar riskli
Ancak Meta, modeli piyasaya sürmeyecek kadar büyük riskler olduğunu söyledi.
Hangi yönlerden risk barındırabileceği açık şekilde dile getirilmese de "Diğer güçlü yeni yapay zeka yeniliklerinde olduğu gibi, bu teknolojinin kötüye kullanım ve istenmeyen zarar potansiyeli getirdiğinin farkındayız" denildi.
Çok sayıda rapor, bu sistemlerin haberlerde sahte videolar oluşturmak, dolandırıcılık çağrılarında insanların seslerini taklit etmek gibi risklerine atıfta bulunuyor.