M­i­c­r­o­s­o­f­t­’­u­n­ ­b­i­z­i­ ­h­a­y­r­e­t­e­ ­d­ü­ş­ü­r­m­e­k­ ­v­e­ ­s­i­n­i­r­l­e­n­d­i­r­m­e­k­ ­i­ç­i­n­ ­y­e­n­i­ ­b­i­r­ ­m­e­t­i­n­d­e­n­ ­k­o­n­u­ş­m­a­y­a­ ­A­I­ ­a­r­a­c­ı­ ­v­a­r­

M­i­c­r­o­s­o­f­t­’­u­n­ ­b­i­z­i­ ­h­a­y­r­e­t­e­ ­d­ü­ş­ü­r­m­e­k­ ­v­e­ ­s­i­n­i­r­l­e­n­d­i­r­m­e­k­ ­i­ç­i­n­ ­y­e­n­i­ ­b­i­r­ ­m­e­t­i­n­d­e­n­ ­k­o­n­u­ş­m­a­y­a­ ­A­I­ ­a­r­a­c­ı­ ­v­a­r­

Görünüşe göre 2023, yapay zekanın (AI) yılı ve Microsoft, harekete geçmeye hevesli en son şirket.

Şirketten araştırmacılar bir gönderi yayınladılar. kağıt (yeni sekmede açılır) metinden konuşmaya araçlarda ileriye doğru büyük sıçramalar görecek yeni bir teknolojinin detaylandırılması.

Kâğıttaki bir özet, VALL-E olarak adlandırılan teknolojinin “bağlam içi öğrenme yeteneklerini nasıl ortaya çıkardığını ve görünmeyen bir konuşmacının yalnızca 3 saniyelik kayıtlı kaydıyla yüksek kaliteli kişiselleştirilmiş konuşmayı sentezlemek için nasıl kullanılabileceğini açıklıyor. akustik komut.”

Bunun basit formlarda anlamı, aracın artık Meta’nın EnCodec’i sayesinde fonem ve akustik kod istemleri dahil olmak üzere bir kişinin sesini yaptığı gibi yapmasını sağlayan şeyleri parçalayabilmesi ve kişinin sesine daha yakından benzeyen bir ses üretebilmesidir. örnek ses kaydının üç saniyesinin ötesinde. VALL-E’nin ilk aşamaları, 60.000 saatin üzerinde İngilizce ses kaydının analiz edilmesiyle mümkün olmuştur.

bu GitHub gönderisi (yeni sekmede açılır) duygusal ipuçlarını ve hatta bir telefon görüşmesinde tipik olan kopuk ses gibi çevresel etkileri sürdürmek de dahil olmak üzere teknolojinin nasıl kullanılabileceğine dair bir dizi örneği ortaya çıkarıyor.

Kısa ve öz olsa da, yapay zekanın daha önce yalnızca hayalini kurduğumuz (veya kabus gördüğümüz) etik kaygıları ortaya çıkardığı bir zamanda giderek daha önemli hale gelen bu tür metinden konuşmaya araçlarının potansiyel etkilerinden bahsediliyor.

Aslında, bir şeye izin veren yanlış kayıtlardan (telefon tabanlı ses tanıma kimlik doğrulaması kullanan bankaların sayısı gibi) çok daha kötüsüne kadar çok sayıda sorun ortaya çıkabilir.

Sonuç, VALL-E’nin modelin kötüye kullanılması durumunda, örneğin ses tanımlamasını taklit etme veya belirli bir konuşmacıyı taklit etme gibi potansiyel riskler taşıyabileceğini belirtir. Benj Edwards Ars Teknik (yeni sekmede açılır) ayrıca, Microsoft’un projenin kodunu başka birinin denemesi için henüz paylaşmadığını ve bu da potansiyel risklerin hala değerlendirilmekte olduğunu belirtti.



işletim-sistemi-1

Popular Articles

Latest Articles