Y­a­p­a­y­ ­Z­e­k­a­ ­T­a­r­a­f­ı­n­d­a­n­ ­O­l­u­ş­t­u­r­u­l­a­n­ ­P­i­z­z­a­ ­R­e­k­l­a­m­ı­ ­E­t­k­i­l­e­d­i­,­ ­A­m­a­ ­E­s­r­a­r­e­n­g­i­z­ ­V­a­d­i­y­i­ ­Z­i­y­a­r­e­t­ ­E­t­t­i­

Y­a­p­a­y­ ­Z­e­k­a­ ­T­a­r­a­f­ı­n­d­a­n­ ­O­l­u­ş­t­u­r­u­l­a­n­ ­P­i­z­z­a­ ­R­e­k­l­a­m­ı­ ­E­t­k­i­l­e­d­i­,­ ­A­m­a­ ­E­s­r­a­r­e­n­g­i­z­ ­V­a­d­i­y­i­ ­Z­i­y­a­r­e­t­ ­E­t­t­i­

Son birkaç ayda, ChatGPT gibi büyük dil modellerinin metin kopyası oluşturabildiğini, Stable Diffusion gibi görüntü oluşturucuların istek üzerine nasıl resim oluşturabildiğini ve hatta bazılarının metinden konuşmaya nasıl yapabildiğini gördük. Daha Sonra Pizza adını alan girişimci bir geliştirici, beş farklı AI modelini birleştirerek “Pepperoni Hug Spot” adlı hayali bir pizza restoranı için bir canlı aksiyon reklamı yarattı.

Ortaya çıkan ve aşağıya eklediğim video aynı anda hem ürkütücü hem de etkileyici. Reklamda yemek yiyen, yemek pişiren ve çok iştah açıcı pepperoni pizza dağıtan foto-gerçekçi insanlar yer alıyor. Hatta kulağa insan gibi gelen bir diyalog ve düzgün bir arka plan müziği var. Ancak bazı karakterlerin yüz ifadeleri ve ölü gözleri biraz fazladır.

Açıkçası, çıktının kalitesi arzulanan bir şey bırakıyor. Bazen nesneler birbiriyle karışıyor gibi görünür; oğlum, insanların tabaktan çıkan pizzayı yiyormuş gibi göründüğünü söyledi.

İnsanların hepsi tekinsiz vadinin sakinleri gibi görünüyor. Ve biraz tutarsız olan senaryo, başka bir dilden yanlış bir şekilde İngilizceye çevrilmiş metin gibi okur (gerçi öyle değildi).

Ancak, bu teknolojilerin prime time’a ne kadar yakın olduğunu görmek etkileyici. Foto-gerçekçi video görüntülerinin kısa sürede nasıl çok daha inandırıcı hale gelebileceğini görebiliriz.

Adil olmak gerekirse, bu video biraz insan düzenlemesi gerektiriyordu. Pizza Later, video için çeşitli varlıklar oluşturmak üzere beş farklı model kullandıklarını ve ardından video, diyalog, müzik ve bazı özel görüntüleri bir araya getirmek için Adobe After Effects kullanarak biraz zaman geçirdiklerini söyledi. Genel olarak, projeyi tamamlamaları 3 saatlerini aldı.

Pizza Later, reklam fikrine erişim kazandıktan sonra sahip olduklarını söyledi. Pist Gen-2 (yeni sekmede açılır), gizli beta sürümünde olan bir metinden videoya modeli. Bir e-posta röportajında, geliştirici bana video için ilk isteklerinin “bir restoranda bir dilim pizza yiyen mutlu bir adam/kadın/aile, televizyon reklamı” olduğunu söyledi. Koşu yolu Gen-1 (yeni sekmede açılır)Mevcut çekimlere dayalı olarak videolar oluşturan , şu anda web’de veya yepyeni bir iOS uygulaması aracılığıyla ücretsiz olarak denenebilir. (yeni sekmede açılır).

Runway Gen-2’nin oluşturduğu yüksek kaliteli videoyu gördükten sonra Pizza Later, kurgusal pizza restoranına (Pepperoni Hug Spot) bir ad bulmak ve senaryoyu yazmak için GPT-4’ü (ChatGPT ve Bing Chat’in arkasındaki motor) kullandı. . Geliştirici daha sonra kullandı ElevenLabs Prime Voice AI (yeni sekmede açılır) erkek sesi ile gerçekçi anlatım sağlamak. Kullandılar MidJourney (yeni sekmede açılır) restoranın dışı ve bazı pizza kalıpları da dahil olmak üzere videoda görünen bazı resimler oluşturmak için. onlar da kullandı ses çizimi (yeni sekmede açılır) fon müziği oluşturmak için.

Pizza Later’ın kullandığı araçların çoğu ücretlidir, ancak bir tür ücretsiz deneme, düşük kaliteli ücretsiz hesap veya ilk ücretsiz kredi seti sunar. Açıkçası, geliştirici nihai sonuçları bir araya getirmek zorunda kaldığından, bu bir tak ve çalıştır işleminden çok uzaktır.

Belki de yakın gelecekte Microsoft Jarvis gibi çok modelli bir araç, tüm bu görevleri tek bir sohbet istemi aracılığıyla gerçekleştirebilecektir. Veya AutoGPT gibi otonom bir aracıya (AutoGPT’nin nasıl kullanılacağına bakın), bir restoranı pazarlamak gibi geniş bir hedef verirseniz, reklamlar üretebilir. Ancak, şimdilik, bu video, insan düzenlemesi gerektirdiğini bilmemize rağmen gerçekten etkileyici.

Popular Articles

Latest Articles