OpenAI, İnsan Sesini 15 Saniyelik Sesle Kopyalayabilen ‘Voice Engine’ Ses Aracının Önizlemesini Yapıyor

OpenAI, kelimeleri ikna edici bir insan sesiyle yüksek sesle okuyabilen bir özellik için yapılan testin ilk sonuçlarını paylaşıyor; yapay zeka için yeni bir sınırın altını çiziyor ve deepfake riskleri hayaletini artırıyor. Bir sözcü, şirketin şu ana kadar yaklaşık 10 geliştiriciyle paylaştığı Voice Engine adlı metinden konuşmaya modelinin küçük ölçekli ön izlemesinden ilk demoları ve kullanım örneklerini paylaştığını söyledi. OpenAI, bu ayın başlarında gazetecilere bilgi verdiği özelliğin daha geniş bir şekilde kullanıma sunulmasına karşı karar verdi.

OpenAI sözcüsü, şirketin politika yapıcılar, sektör uzmanları, eğitimciler ve yaratıcılar gibi paydaşlardan geri bildirim aldıktan sonra sürümün ölçeğini küçültmeye karar verdiğini söyledi. Daha önceki basın brifingine göre şirket, başlangıçta aracı bir başvuru süreci aracılığıyla 100’e kadar geliştiriciye sunmayı planlamıştı.

Şirket Cuma günkü bir blog yazısında, “İnsan seslerine benzeyen konuşmalar üretmenin ciddi riskler taşıdığının farkındayız ve bu riskler özellikle seçim yılında akla ilk gelenler” diye yazdı. “Geliştirirken onların geri bildirimlerini dahil ettiğimizden emin olmak için hükümet, medya, eğlence, eğitim, sivil toplum ve diğer alanlardan ABD’li ve uluslararası ortaklarla iletişim halindeyiz.”

Bazı bağlamlarda sesleri taklit etmek için diğer yapay zeka teknolojileri zaten kullanıldı. Ocak ayında, Başkan Joe Biden’dan geldiği iddia edilen sahte ama kulağa gerçekçi gelen bir telefon görüşmesi, New Hampshire’daki insanları ön seçimlerde oy kullanmamaya teşvik etti; bu, kritik küresel seçimler öncesinde yapay zeka korkularını körükleyen bir olaydı.

OpenAI’nin ses içeriği üretmeye yönelik önceki çabalarının aksine, Voice Engine, bireysel insanlar gibi ses çıkaran, kendilerine özgü ritim ve tonlamalarla tamamlanan konuşmalar oluşturabilir. Yazılımın ihtiyacı olan tek şey, konuşan bir kişinin sesini yeniden oluşturmak için 15 saniyelik kayıtlı sestir.

Aracın bir gösterimi sırasında Bloomberg, OpenAI İcra Kurulu Başkanı Sam Altman’ın, gerçek konuşmasından farklı olmayan ancak tamamen yapay zeka tarafından üretilmiş bir sesle teknolojiyi kısaca açıklayan bir klibini dinledi.

OpenAI ürün lideri Jeff Harris, “Doğru ses kurulumuna sahipseniz, bu temelde insan kalibresinde bir ses olacaktır” dedi. “Oldukça etkileyici bir teknik kalite.” Ancak Harris şunları söyledi: “İnsan konuşmasını gerçekten doğru bir şekilde taklit etme yeteneği konusunda açıkçası pek çok güvenlik hassasiyeti var.”

OpenAI’nin aracı kullanan mevcut geliştirici ortaklarından biri olan, kâr amacı gütmeyen sağlık sistemi Lifespan’daki Norman Prince Nörobilim Enstitüsü, hastaların seslerini iyileştirmelerine yardımcı olmak için teknolojiyi kullanıyor. Örneğin şirketin blog yazısında, aracın, beyin tümörü nedeniyle net konuşma yeteneğini kaybeden genç bir hastanın, bir okul projesi için daha önceki bir kayıttaki konuşmasını kopyalayarak sesini geri kazandırmak için kullanıldığı belirtildi.

OpenAI’nin özel konuşma modeli, ürettiği sesi farklı dillere de çevirebilir. Bu da onu Spotify Technology SA gibi ses sektöründeki şirketler için faydalı kılıyor. Spotify, Lex Fridman gibi popüler sunucuların podcast’lerini çevirmek için bu teknolojiyi kendi pilot programında zaten kullandı. OpenAI ayrıca çocuklara yönelik eğitim içeriği için daha geniş bir yelpazede ses yaratmak gibi teknolojinin diğer faydalı uygulamalarını da duyurdu.

Test programında OpenAI, ortaklarının kullanım politikalarını kabul etmelerini, sesini kullanmadan önce orijinal konuşmacının onayını almalarını ve dinleyicilere duydukları seslerin yapay zeka tarafından oluşturulduğunu açıklamalarını istiyor. Şirket ayrıca, bir ses parçasının kendi aracı tarafından oluşturulup oluşturulmadığını ayırt edebilmesini sağlamak için duyulamayan bir ses filigranı da kuruyor.

OpenAI, özelliğin daha geniş bir şekilde yayınlanıp yayınlanmayacağına karar vermeden önce, dış uzmanlardan geri bildirim istediğini söyledi. Şirket, blog yazısında şunları söyledi: “Dünyanın her yerindeki insanların, biz onu geniş çapta kendimiz kullansak da kullanmasak da, bu teknolojinin nereye doğru gittiğini anlaması önemlidir.”

OpenAI ayrıca yazılımının önizlemesinin, daha gelişmiş yapay zeka teknolojilerinin getirdiği zorluklara karşı “toplumsal dayanıklılığı artırma ihtiyacını motive etmesini” umduğunu da yazdı. Örneğin şirket, bankalara, banka hesaplarına ve hassas bilgilere erişimde bir güvenlik önlemi olarak sesli kimlik doğrulamayı aşamalı olarak kaldırma çağrısında bulundu. Aynı zamanda yanıltıcı yapay zeka içeriği hakkında kamu eğitimi ve ses içeriğinin gerçek mi yoksa yapay zeka tarafından mı oluşturulduğunu tespit etmeye yönelik tekniklerin daha fazla geliştirilmesini istiyor.

(Bu hikaye NDTV personeli tarafından düzenlenmemiştir ve ortak yayından otomatik olarak oluşturulmuştur.)

Bağlı kuruluş bağlantıları otomatik olarak oluşturulabilir; ayrıntılar için etik bildirimimize bakın.

genel-8

Popular Articles

Latest Articles

Other Articles