O­p­e­n­A­I­’­ı­n­ ­M­e­t­i­n­d­e­n­ ­V­i­d­e­o­ ­Ü­r­e­t­m­e­ ­A­r­a­c­ı­ ­S­o­r­a­’­n­ı­n­ ­Y­a­p­a­b­i­l­e­c­e­k­l­e­r­i­,­ ­S­i­z­i­ ­B­ü­y­ü­l­e­n­m­e­k­l­e­ ­Ü­r­p­e­r­m­e­k­ ­A­r­a­s­ı­n­d­a­ ­B­ı­r­a­k­a­c­a­k­

O­p­e­n­A­I­’­ı­n­ ­M­e­t­i­n­d­e­n­ ­V­i­d­e­o­ ­Ü­r­e­t­m­e­ ­A­r­a­c­ı­ ­S­o­r­a­’­n­ı­n­ ­Y­a­p­a­b­i­l­e­c­e­k­l­e­r­i­,­ ­S­i­z­i­ ­B­ü­y­ü­l­e­n­m­e­k­l­e­ ­Ü­r­p­e­r­m­e­k­ ­A­r­a­s­ı­n­d­a­ ­B­ı­r­a­k­a­c­a­k­

OpenAI, DALL-E modelini karşımıza ilk çıkardığında basit tariflerle o dönem kaliteli sayılabilecek görseller elde edebilmemize şaşırıyorduk. O zamandan bu zamana kadar köklü şekilde gelişen görsel üretme araçları DALL-E’yi geride bırakırken ChatGPT’nin doğuşuna ve günümüzdeki GPT-4’e kadar süren gelişimine şahit olduk.

Güncel olarak da GPT-4 kullanan ChatGPT, kullanımı en basit ve en iyi sonuç veren model olarak biliniyor. En azından OpenAI, şimdiye kadar ortaya koyduğu en büyük dil modeli olan Sora’yı çıkarana kadar durum buydu. Tabii gecenin bi’ vakti önümüze konulan bu modelin ne olduğunu ve diğerlerinden farkını ilk bakışta anlamamız zor. Bu yüzden de Sora’nın ne olduğunu, nasıl çalıştığını ve nelere imkân sağlayacağını sizlere anlatacağız.

Sora, dediğimiz gibi OpenAI’ın şimdiye kadar ürettiği en büyük dil modeli. Yapabildikleri de video üretimiyle sınırlı değil. Sabit fotoğrafları canlandırıyor, videoları ileri ya da geri saracak şekilde uzatabiliyor, video haricinde sade fotoğraf üretebiliyor, videoları birbirine bağlayabiliyor, hem görsel, hem video hem de prompt ile tarif alabiliyor, kamera hareketinde daha nesneleri ve insanları daha tutarlı hareket ettiriyor, obje karenin dışına çıkıp döndüğünde bile tutarlı görünmesini sağlıyor vb. birçok konuda Sora, benzerlerinin çok ötesinde.

Sora hem yazı hem video hem metin hem de görsel girişiyle kaliteli video çıktıları verdiği ve bunları tutarlı bir şekilde birleştirebildiği için bu alanda iş görecektir.

Bu da farklı platformlar için farklı en/boy oranına sahip videolar üretebilirsiniz demek.

Bu da ortam veya nesne değiştirmek için maskeleme, alan doldurma gibi yüklerle uğraşmadan sahneleri oluşturup nesnenizi oraya eklemenizi mümkün kılacaktır. Bu durum tam tersi de olabilir, yaratıcılığınıza kalmış. Örneğin üstteki videoda farklı ortamlara kayıpsız geçiş yapıldığını görebilirsiniz.

Şu an için bu model, bazı fizik kurallarını işleyemediği için yukarıdaki videoda gördüğünüz plastik sandalyeyi veya kırılması gereken bir cam bardağı tam olarak olması gerektiği gibi işleyemiyor. Fakat alttaki videoya bir bakın.

Daha üzerinden 1 yıl geçmemişken bu aşamaya gelebildiysek, Sora çok kısa zamanda bu problemleri de aşacaktır. Sizin düşünceleriniz neler?

İLGİLİ HABER

OpenAI, Metinden Video Oluşturan Yapay Zekâ Modeli "Sora"yı Tanıttı: Ağzınızı Açık Bırakacak!

Popular Articles

Latest Articles