![Microsoft, 3 Saniyelik İstemlerden Herhangi Bir Sesi Simüle Eden Ses Yapay Zekası VALL-E’yi Tanıttı](https://kilalu.blog/news/2024-07-11-07:58/Microsoft, 3 Saniyelik İstemlerden Herhangi Bir Sesi Simüle Eden Ses Yapay Zekası VALL-E’yi Tanıttı.jpg)
Microsoft araştırmacıları kısa bir süre önce, üç saniyelik bir ses örneği verildiğinde bir kişinin sesini doğru bir şekilde taklit edebilen yeni bir metinden konuşmaya yapay zeka modeli olan VALL-E’yi duyurdu. VALL-E, belirli bir sesi öğrendiğinde, konuşmacının duygusal tonunu korumaya çalışırken, herhangi bir şey söyleyen kişinin sesini sentezleyebilir. VALL-E’nin yaratıcıları, GPT-3 gibi diğer üretken AI modelleriyle birleştirildiğinde, yüksek kaliteli metin okuma uygulamaları, bir kişinin kaydının düzenlenebildiği ve bir metin dökümünden değiştirilebildiği konuşma düzenleme için kullanılabileceğine inanıyor. (aslında söylemedikleri bir şeyi söylemelerini sağlamak) ve sesli içerik oluşturma.
Microsoft’a göre, VALL-E öncelikle bir “nöral codec dil modeli”dir ve Meta’nın Ekim 2022’de kullanıma sunduğu EnCodec’e dayanır. dalga biçimlerinin manipüle edilmesi. Bir kişinin nasıl ses çıkardığını işler, EnCodec’i kullanarak ilgili verileri ayrı bileşenlere (“belirteçler” olarak adlandırılır) ayırır ve ardından, o sesin ötesinde başka ifadeler söylerse nasıl ses çıkarabileceğine ilişkin “bildiğini” eşleştirmek için eğitim verilerini kullanır. üç saniyelik örnek.
Microsoft, Meta’nın LibriLight ses kitaplığını kullanarak VALL-E’nin konuşma sentezi işlevlerini eğitti. Öncelikle LibriVox kamuya açık sesli kitaplardan alınan 7.000’den fazla konuşmacının 60.000 saatlik İngilizce konuşmasını içerir. VALL-E’nin iyi bir sonuç vermesi için üç saniyelik örnekteki sesin öğrenme algoritmasındaki bir sese çok benzemesi gerekir.
Amerikan teknoloji devi, yapay zeka modelinin iş başında olduğu düzinelerce sesli örnek sunuyor. VALL-E örnek web sitesi. “Konuşmacı İstemi” veri seti, taklit etmeye çalışması gereken VALL-E’ye verilen üç saniyelik sestir. “Yer Gerçeği”, aynı konuşmacının karşılaştırma amacıyla belirli bir cümleyi söyleyen önceden kaydedilmiş bir versiyonudur (deneydeki “kontrol” gibi). “Temel” örneği, geleneksel bir metinden konuşmaya sentez yöntemiyle üretilir ve “VALL-E” örneği, VALL-E modeli tarafından oluşturulur.
Microsoft araştırmacıları tarafından örnek web sitesinde gösterildiği gibi bir VALL-E blok diyagramı
Fotoğraf Kredisi: Microsoft
Araştırmacılar, bu sonuçları elde etmek için yalnızca üç saniyelik “Konuşmacı İstemi” örneğini ve bir metin dizisini (sesin söylemesini istedikleri şeyi) VALL-E’ye sağladılar. Bazı VALL-E sonuçları bilgisayar tarafından oluşturulmuş gibi görünür, ancak diğerleri, modelin amacı olan insan konuşması nedeniyle yanlış anlaşılabilir. VALL-E’nin suçları ve aldatmacayı körükleme potansiyeli nedeniyle Microsoft, VALL-E kodunu başkalarının keşfetmesi için kullanılabilir hale getirmedi. Araştırmacılar, bu teknolojinin neden olabileceği potansiyel sosyal zararın farkında gibi görünüyor.
Makalenin sonuç bölümünde şöyle yazıyorlar: “VALL-E, konuşmacı kimliğini koruyan konuşmayı sentezleyebildiğinden, modelin kötüye kullanılması durumunda, ses kimliğinin sahtekarlığı veya belirli bir konuşmacının kimliğine bürünme gibi potansiyel riskler taşıyabilir. Bu tür riskleri azaltmak mümkündür. bir ses klibinin VALL-E tarafından sentezlenip sentezlenmediğini ayırt etmek için bir algılama modeli oluşturmak. Modelleri daha da geliştirirken Microsoft AI İlkelerini de uygulamaya koyacağız.”
CES 2023 merkezimizde Gadgets 360 ile ilgili Tüketici Elektroniği Şovundan en son haberleri alın.
![](https://teknomerscdn.cloudspecter.com/wp-content/uploads/2022/10/Redmi-Note-12-Explorer-Surumu-Bugun-Lansmandan-Once-210W-Hizli.png)
Poco C55’in Yeniden Markalanmış Bir Redmi 12C Olacağı Belirtildi, Yakında Piyasaya Sürülmesi Bekleniyor
Günün öne çıkan videosu
Disney+ Hotstar Ocak 2023: Sonumuz, Taaza Khabar ve daha fazlası!
Advertisement
Popular Articles
- 20 Jul Kanserle savaşta etkili yöntem İmmünoterapi
- 14 Jul Rıza Çalımbaydan hakemlere tepki
- 24 Jul Rol Aldıkları Dizi ve Filmlerle Gönlümüze Taht Kurmuş 15 Hayvan Karakter
- 20 Jul SON DAKİKA| Çöp evde bulunan çocuğun sağlık durumu nasıl? Hastaneden açıklama geldi, kilosu şaşkına çevirdi - Son Dakika Haberler
- 25 Jul Deathloop Güncellemesi 1.260 Bu 25 Nisan’da Çıkıyor
Latest Articles
- 01 Jul Samsung Galaxy S23 ön siparişlerinde ücretsiz Galaxy Buds 2 Pro bulunabilir
- 30 Jun Popüler Root Aracı Magiskin Son Canary Sürümüne Android 11 Desteği Geldi
- 22 Jun Batman, Dr. Strange, Thor ve Daha Fazlası: Sabırsızlıkla Beklediğimiz 2022 Yılında Vizyona Girecek Tüm Filmler
- 19 Jul Son dakika... Balıkesirde 4 büyüklüğünde deprem
- 09 Jul Nvidia hisseleri AMD’nin açıklamasının ardından düştü!
Other Articles
- Google, Privacy Sandbox Beta’yı 2023’ün Başlarına Kadar Android 13’te Kullanıma Sunacak
- Kenan Doğulu garsonlara bağırdı
- Nevşehirde traktör kazası: 1 ölü, 3 yaralı
- Otomobil ile tır çarpıştı: 3 ölü 1 yaralı
- Jüpiter’in Yakınında Tespit Edilen 19 Asteroitin Güneş Sistemi Dışından Geldiği Düşünülüyor