OpenAInin Sorasını anlamak ister misiniz? Midjourney ve DALL-E 2ye bir göz atın.

Ne zaman olduğunu hatırla yapay zeka sanat yaratıcıları 2022'de yaygın olarak kullanıma sunuldu ve birdenbire internet çok havalı ama yakından bakıldığında pek de doğru görünmeyen esrarengiz resimlerle doldu. Bunun tekrar olmasına hazır olun, ancak bu sefer video için.

Geçtiğimiz hafta OpenAI, basit bir istemle videolar üreten üretken bir yapay zeka modeli olan Sora'yı piyasaya sürdü. Henüz halka açık değil ancak CEO Sam Altman, eskiden X olarak bilinen X'ten talep alarak yeteneklerini gösterdi. heyecan. Kullanıcılar kısa istemlerle yanıt verdi: “parkta satranç oynayan bir maymun,” veya “sporcular olarak farklı hayvanların yer aldığı okyanusta bisiklet yarışı.” Tekinsiz, büyüleyici, tuhaf, güzel ve olağan yorum döngüsünü harekete geçiriyor.

Bazı insanlar Sora'nın durumuyla ilgili güçlü iddialarda bulunuyor olumsuz etkilerbir “bekliyoruz”dezenformasyon dalgası” – ama ben (ve uzmanlar) düşünürken Geleceğin güçlü yapay zeka sistemleri gerçekten ciddi riskler taşıyorBelirli bir modelin dezenformasyon dalgasını üzerimize getireceği iddiaları şu ana kadar ayakta kalmadı.

Diğerleri ise Sora'nın birçok kusurunu temsil ediyormuş gibi gösteriyor temel sınırlamalar İnsanlar bunu görüntü oluşturucu modellerle yaparken bu bir hataydı ve sanırım yine bir hata olacak. Meslektaşım AW Ohlheiser olarak işaret etti“Tıpkı DALL-E ve ChatGPT'nin zaman içinde gelişmesi gibi, Sora da aynısını yapabilir.”

Hem yükseliş hem de düşüş yönündeki tahminler henüz gerçekleşmeyebilir; ancak Sora ve üretken yapay zeka hakkındaki konuşma, eğer her iki taraftaki insanlar son birkaç yılda hatalı olduğumuz tüm yolları daha fazla hesaba katsaydı daha verimli olurdu. .

DALL-E 2 ve Midjourney bize Sora hakkında neler öğretebilir?

İki yıl önce OpenAI duyurdu DALL-E 2, bir metin isteminden hareketsiz görüntüler üretebilen bir model. Ürettiği yüksek çözünürlüklü fantastik görüntüler kısa sürede tüm sosyal medyada yayıldı. almak bunun hakkında ne düşünmeliyiz: Gerçek sanat mı? Sahte sanat mı? Sanatçılar için bir tehdit mi? Sanatçılar için bir araç mı? Dezenformasyon makinesi mi? İki yıl sonra, eğer Sora'ya dair düşüncelerimizin daha iyi yaşlanmasını istiyorsak, biraz geçmişe bakmaya değer.

DALL-E 2'nin piyasaya sürülmesinden sadece birkaç ay önceydi Yolculuk ortası Ve Kararlı Difüzyon, iki popüler rakip. Her birinin güçlü ve zayıf yönleri vardı. DALL-E 2 daha fotogerçekçi resimler yaptı ve yönlendirmelere biraz daha iyi uydu; Yolculuğun ortası “daha sanatsal”dı. Toplu olarak, yapay zeka sanatını tek bir tıklamayla milyonlara ulaştırdılar.

Üretken yapay zekanın toplumsal etkisinin çoğu doğrudan DALL-E 2'den değil, onun öncülük ettiği görüntü modelleri dalgasından geliyordu. Aynı şekilde Sora ile ilgili önemli sorunun sadece Sora'nın neler yapabileceği değil, onu taklit edenlerin ve rakiplerinin neler yapabileceği de olmasını bekleyebiliriz.

Birçok kişi DALL-E ve rakiplerinin yeni bir gelişmenin habercisi olduğunu düşünüyordu. Deepfake propaganda ve dolandırıcılık seli bu demokrasimizi tehdit eder. Bir gün buna benzer bir etki görme ihtimalimiz olsa da, bu çağrılar artık erken gibi görünüyor. Analist Peter Carlyon, deepfake'lerin demokrasimiz üzerindeki etkisi “her zaman çok yakında görünüyor” diyor Aralık ayında yazdıçoğu propagandanın daha sıkıcı bir tür olmaya devam ettiğini belirtiyor – örneğin, açıklamaları bağlamdan çıkarmak veya bir çatışmaya ilişkin görsellerin paylaşılması ve diğerine aitmiş gibi yanlış etiketlenmesi.

Muhtemelen bir noktada bu değişecek, ancak bu değişikliğin Sora olacağı yönündeki iddialarda biraz alçakgönüllülük olmalı. İnsanlara yalan söylemek için deepfake gerekmiyor ve bunu yapmanın pahalı bir yolu olmaya devam ediyor. (Yapay zeka nesilleri nispeten ucuzdur, ancak spesifik ve ikna edici bir şey arıyorsanız bu çok daha pahalıdır. Deepfake tsunamisi, spam gönderenlerin şu anda çoğunlukla karşılayamayacağı bir boyut anlamına gelir.)

Ancak yapay zeka tarihinin son iki yılını hatırlamanın benim için en önemli olduğu yer, Sora'nın görsellerinin beceriksiz, yapmacık, insanlık dışı veya açıkça kusurlu olduğu yönündeki eleştirileri okuduğum zamandır. Doğru, öyleler. OpenAI'nin araştırma bülteninde Sora'nın “birçok temel etkileşimin fiziğini doğru bir şekilde modellemediği” kabul ediliyor: ekleme Sebep-sonuç ilişkisinde sorun yaşıyor, sağı ve solu birbirine karıştırıyor ve bir yol izliyor.

Elbette DALL-E 2 ve Midjourney'e de neredeyse aynı eleştiriler yapıldı – en azından ilk başta. DALL-E 2'nin ilk yayınlarında, bir sahnede birden fazla karakter istendiğinde korkunç canavarlar yaratmaktan, insanlara Eller yerine pençeler. Yapay zeka uzmanları, yapay zekanın “kompozisyonluluğu” veya bir sahnenin öğelerinin nasıl oluşturulacağına ilişkin talimatları ele alma konusundaki yetersizliğinin, tartışıldığını savundu. teknolojideki temel bir eksikliği yansıtıyordu.

Ancak uygulamada modeller son derece spesifik istemleri yerine getirmede daha iyi hale geldi ve kullanıcılar da yönlendirmede daha iyi hale geldi ve sonuç olarak günümüzde karmaşık ve ayrıntılı sahnelere sahip görüntüler oluşturmak mümkün. Geçen yıl piyasaya sürülen DALL-E 3'te ve Midjourney'e gelen son güncellemelerde neredeyse tüm eğlenceli eksiklikler düzeltildi. Günümüzün görüntü oluşturucuları eller ve kalabalık sahneleri gayet iyi bir şekilde gerçekleştirebilmektedir.

DALL-E 2 ile Sora arasındaki dönemde, yapay zeka görüntü üretimi bir parti numarasından devasa bir sektöre dönüştü. DALL-E 2'nin yapamadığı pek çok şeyi DALL-E 3 yapabilirdi. Ve eğer DALL-E 3 yapamıyorsa, bir rakip sıklıkla yapabilirdi. Bu, Sora'da öngörüde bulunmayı okuduğunuzda akılda tutulması gereken çok önemli bir bakış açısıdır; muhtemelen iyi ya da kötü amaçlarla kullanılabilecek büyük bir yeni yeteneğe yönelik ilk adımlara bakıyorsunuzdur. Aşırı satış yapmak mümkün olduğu kadar, açığa satmak da çok kolaydır.

Sora ve haleflerinin ne yapıp yapamayacağına dair belirli bir perspektife aşırı bağlılık yerine, bunun nereye varacağı konusunda bazı belirsizlikleri kabul etmeye değer. Bunun nasıl sonuçlanacağının ayrıntılarını tahmin etmektense, “Bu teknoloji hızla gelişmeye devam edecek” demek çok daha kolaydır.

Bu hikayenin bir versiyonu ilk olarak Gelecek Mükemmel bülten. Buradan kaydolun!

Kaynak bağlantısı

DALL-E 2 ve Midjourney bize Sora hakkında neler öğretebilir?

Popular Articles

Latest Articles

Other Articles

O­p­e­n­A­I­­n­i­n­ ­S­o­r­a­­s­ı­n­ı­ ­a­n­l­a­m­a­k­ ­i­s­t­e­r­ ­m­i­s­i­n­i­z­?­ ­ ­M­i­d­j­o­u­r­n­e­y­ ­v­e­ ­D­A­L­L­-­E­ ­2­­y­e­ ­b­i­r­ ­g­ö­z­ ­a­t­ı­n­.­

DALL-E 2 ve Midjourney bize Sora hakkında neler öğretebilir?

Popular Articles

Latest Articles

Other Articles

OpenAInin Sorasını anlamak ister misiniz? Midjourney ve DALL-E 2ye bir göz atın.