G­e­m­i­n­i­ ­A­I­ ­d­e­m­o­s­u­ ­s­a­h­t­e­ ­ç­ı­k­t­ı­!­

G­e­m­i­n­i­ ­A­I­ ­d­e­m­o­s­u­ ­s­a­h­t­e­ ­ç­ı­k­t­ı­!­

Google’ın yeni Gemini AI modeli, dünkü büyük çıkışının ardından karışık tepkiler alıyor. Ancak kullanıcılar, Gemini’nin en etkileyici demosunun büyük ölçüde sahte olduğunu öğrendikten sonra şirketin teknolojisine veya bütünlüğüne daha az güvenebilecek.

“Gemini ile Uygulamalı: Multimodal AI ile Etkileşim” adlı video geçtiğimiz gün bir milyon izlenme sayısına ulaştı ve bunun nedenini anlamak zor değil. Etkileyici demo, “Gemini ile en sevdiğimiz etkileşimlerden bazılarını vurguluyor” ve multimodal modelin (nasıl esnek olabileceğini ve çeşitli girdilere duyarlı olabileceğini gösteriyor.

Başlangıç ​​olarak, bir ördeğin bir dalgalı çizgiden tamamlanmış bir çizime doğru evrimleşen bir taslağını anlatıyor. Bunun gerçekçi olmayan bir renk olduğunu söylüyor, sonra oyuncak mavi bir ördeği görünce şaşkınlık ortaya koyuyor. Daha sonra o oyuncakla ilgili çeşitli sesli sorulara yanıt veriyor ve ardından demo, bardak değiştirme oyununda topu takip etmek, gölge kukla hareketlerini tanımak, gezegen çizimlerini yeniden düzenlemek vb. gibi diğer gösteriş hareketlerine geçiyor.

Her ne kadar videoda “gecikme azaltıldı ve Gemini çıktıları kısaltıldı” uyarısı yapılsa da hepsi oldukça duyarlı. Yani burada bir tereddütü, şurada da çok uzun bir cevabı atlıyor. Sonuç olarak, çok modlu anlayış alanında oldukça akıllara durgunluk veren bir güç gösterisiydi. Uygulamalı videoyu izlediğimde, Google’ın bir yarışmacı gönderebileceğine dair şüphelerim darbe aldı.

Tek bir sorun var: Video gerçek değil. Bloomberg’den Parmy Olson: “Gemini’nin yeteneklerini çok çeşitli zorluklarla test etmek için görüntüleri kaydederek demoyu oluşturduk. Daha sonra Gemini’ye görüntülerdeki sabit görüntü karelerini kullanmasını ve metin yoluyla yönlendirme yapmasını sağladık” diyor. Her ne kadar Google’ın videoda gösterdiği şeyleri bir nevi yapsa da canlı olarak ve ima ettikleri şekilde yapmadı ve belki de yapamadı. Gerçekte bu, etkileşimin gerçekte nasıl olduğunu yanlış anlatmak için açıkça seçilmiş ve kısaltılmış, hareketsiz görüntülerden oluşan, dikkatle ayarlanmış bir dizi metin istemiydi. Gerçek istemlerden ve yanıtlardan bazılarını ilgili bir blog gönderisinde görebilirsiniz. Bir yandan Gemini gerçekten de videoda gösterilen yanıtları vermiş gibi görünüyor. Ve kim modele önbelleğini temizlemesini söylemek gibi bazı temizlik komutlarını görmek ister? Ancak izleyiciler modelle olan etkileşimin hızı, doğruluğu ve temel modu konusunda yanıltılıyor.

Ancak yeteneğin belgelenmesindeki ilk şey, modelin bireysel hareketleri görmeye dayalı olarak nasıl akıl yürütmediği. Google ise videonun “Gemini’den gerçek çıktılar gösterdiğini” söylüyor.

Popular Articles

Latest Articles