W­W­D­C­ ­2­0­2­4­’­t­e­ ­A­I­,­ ­S­i­r­i­’­y­i­ ­A­p­p­l­e­’­ı­n­ ­h­e­r­ ­z­a­m­a­n­ ­i­s­t­e­d­i­ğ­i­ ­s­e­s­l­i­ ­a­s­i­s­t­a­n­ ­h­a­l­i­n­e­ ­g­e­t­i­r­e­b­i­l­i­r­

W­W­D­C­ ­2­0­2­4­’­t­e­ ­A­I­,­ ­S­i­r­i­’­y­i­ ­A­p­p­l­e­’­ı­n­ ­h­e­r­ ­z­a­m­a­n­ ­i­s­t­e­d­i­ğ­i­ ­s­e­s­l­i­ ­a­s­i­s­t­a­n­ ­h­a­l­i­n­e­ ­g­e­t­i­r­e­b­i­l­i­r­


Apple, 2011 yılında iPhone 4S ile birlikte Siri’yi ilk kez piyasaya sürdüğünde, şirket bu yeni moda sesli asistan şeyini nasıl kullanabileceğinizi gösteren çok ilgi çekici bir dizi reklam yaptı. Birinde Zooey Deschanel telefonuna domates çorbası dağıtmayı soruyor; bir diğerinde John Malkovich varoluşsal yaşam tavsiyeleri istiyor. Ayrıca Martin Scorsese’nin New York City taksisinin arkasından programını karıştırdığı bir sahne var. Hatırlatıcılar, hava durumu, alarmlar ve daha fazlasını gösterdiler. Reklamların amacı, Siri’nin ihtiyacınız olan her şeyin üstesinden gelebilecek kullanışlı, sürekli bir yol arkadaşı olduğuydu. Uygulamaya veya dokunmaya gerek yok. Sadece sor.

Siri, Apple için çok önemliydi. 4S lansman etkinliğinde Apple’dan Phil Schiller, Siri’nin yeni cihazın en iyi özelliği olduğunu söyledi. “On yıllardır teknoloji uzmanları, teknolojiyle konuşabileceğiniz ve onun bizim için bir şeyler yapabileceği hayaliyle bizimle dalga geçtiler” dedi. “Ama bu asla gerçekleşmez!” Aslında yapmak istediğimiz tek şey, cihazımızla istediğimiz şekilde konuşmak, bilgi ve yardım almaktır, dedi. Schiller, klasik bir Apple kabadayılığıyla Apple’ın sorunu çözdüğünü ilan etti.

Apple bunu çözememişti. İlk lansmandan bu yana geçen 13 yıl içinde Siri, çoğu insan için ya zamanlayıcıları ayarlamanın bir yolu ya da ne pahasına olursa olsun kaçınılması gereken işe yaramaz bir özellik haline geldi. Siri uzun zamandır kötüydü; öyle uzun zamandır öyle görünüyor ki, Apple ya onu unutmuş ya da sadece yokmuş gibi davranmayı seçmiş gibi görünüyor.

Ancak önümüzdeki hafta WWDC’de eğer söylentiler ve raporlar doğruysa, gerçek Siri’yle ilk kez ya da en azından ona çok daha yakın bir şeyle tanışmak üzere olabiliriz. Buna göre Bloomberg, New York Timesve diğerleri gibi Apple, asistan için büyük bir revizyonu açıklayacak; bu, büyük dil modelleri sayesinde Siri’yi daha güvenilir hale getirecek ancak çok fazla yeni işlevsellik gerektirmeyecek. Bu bile bir kazanç olacaktır. Ancak Apple aynı zamanda uygulamaların içine entegre olacak bir Siri sürümü üzerinde çalışıyor ve neredeyse kullanıma hazır gibi görünüyor; bu, asistanın sizin adınıza cihazınız üzerinde işlem yapabileceği anlamına geliyor. Teorik olarak, en azından telefonunuzda yapabileceğiniz her şeyi Siri yakında sizin için de yapabilir.

Bu açıkça Siri’nin başından beri vizyonuydu. Bunu iPhone 4S reklamlarında bile görebilirsiniz: Bu ünlüler Siri’den yardım istiyor ve Siri neredeyse hiçbir zaman işi bitirmiyor. Deschanel’e teslimattan bahseden restoranların bir listesini veriyor ancak ona herhangi bir sipariş vermeyi veya menüyü göstermeyi teklif etmiyor. Scorsese’ye trafik olduğunu söylüyor ama onu yeniden yönlendirmiyor – ve onun toplantısına geç kalacağını zaten bilmesi gerekmez mi? Siri, Malkovich’e insanlara karşı nazik olmasını ve iyi bir kitap okumasını söylüyor ancak pratik bir yardım sunmuyor. Şu ana kadar Siri’yi kullanmak, sizin için tek işi Google’la ilgili şeyler yapmak olan bir sanal asistana sahip olmak gibidir. Bu da bir şey! Ama fazla değil.

Siri’nin yetersizlikleri daha da sinir bozucu oldu çünkü kullanışlı olması için ihtiyaç duyduğu her şey tam orada telefonunda. Pizza istediğimde, Siri neden son sipariş verdiğim makbuz için e-postamı kontrol edemiyor, DoorDash’i açamıyor, aynı siparişi giremiyor, Apple Cüzdanımdaki kartlardan biriyle ödeme yapıp bu işi bitiremiyor? Scorsese düzeyinde yoğun bir gün geçirirsem Siri, tüm kişilerimin, Slack’imin, e-postamın ve benim adıma işleri hızlı bir şekilde hareket ettirmek için ihtiyaç duyduğu her şeyin yanında görünüyor. Siri, bir başkasının bilgisayarınızın imlecini hareket ettirmesine olanak tanıyan uzaktan erişim araçlarından biri gibi telefonumu ele geçirebilseydi, bu durdurulamaz olurdu.

Aslında Siri’nin bu şekilde potansiyeline ulaşamamasının iki nedeni var. Birincisi basit olanı: Temeldeki teknoloji yeterince iyi değildi. Siri’yi kullandıysanız, ne sıklıkla isimleri yanlış duyduğunu, komutları yanlış anladığını ve tek istediğiniz bir podcast dinlemek iken “işte web’de bulduğum bazı şeyler”e geri döndüğünü bilirsiniz. Burası büyük dil modellerinin tartışmasız çok heyecan verici olduğu noktadır çünkü Whisper gibi konuşmayı metne dönüştürme araçlarının ne kadar daha iyi olduğunu ve bu modellerin dili ne kadar geniş anlamda anlayabildiğini gördük. Mükemmel değiller ama daha önce yaşadıklarımıza göre çok büyük bir gelişme; bu yüzden Amazon da Alexa’yı Yüksek Lisans’a yönlendiriyor ve Google’ın Asistanı Gemini tarafından istila ediliyor.

Siri’nin hiçbir zaman tam olarak çalışmamasının ikinci nedeni, ne Apple’ın ne de üçüncü taraf geliştiricilerin bunun nasıl olduğunu asla anlayamamış olmalarıdır. meli iş. Siri’nin ne yapabileceğini veya nasıl soracağını nasıl bilebilirsin? Geliştiricilerin Siri’yi nasıl entegre etmesi gerekiyor? Şimdi bile yapılacaklar listesi uygulamanıza bir görev eklemek istediğinizde Siri hangi uygulamayı kullandığınızı anlayamıyor. Söylemek zorundasın, Hey Siri, Todoist’te çimleri sulamayı bana hatırlat, bu hiçbir anlam ifade etmeyen tuhaf bir cümle ve deneyimlerime göre zaten yarıda başarısız oluyor. Çok adımlı bir işlem yapmak istiyorsanız tek seçeneğiniz, çok güçlü bir araç olan ancak kod yazmanızı gerektirme konusunda yetersiz kalan Kısayollar’da dolaşmaktır. Çoğu insan için bu çok fazla.

Yapay zeka aynı zamanda Apple’a tüm sorunu çözme şansı da verebilir. Araştırmacılar bu yılın başlarında, ekrandaki görüntünün küçük ayrıntılarını anlamak için yapay zeka modelini kullanan Ferret-UI adlı bir sistemin ayrıntılarını anlatan bir makale yayınladılar. Araştırmacılar, Siri’yi kullanan genel bir uygulamanın nasıl çalışabileceğini bile detaylandırıyor: OpenAI’nin GPT-4’ü, bir görüntünün ne olduğunu geniş anlamda anlama konusunda iyi bir iş çıkarıyor ve ardından Ferret, küçük bölgeleri ve ayrıntıları anlayabiliyor. Pratikte bu, bir sistemin “Bu, Ticketmaster uygulaması!” demesi anlamına gelebilir. diğeri ise “İşte orada satın alma butonu var” diyor.

Apple’ın Siri hakkında ileri sürdüğü iddialara şüpheyle yaklaşmalıyız. On yıldan fazla bir süre önce Schiller sahneye çıktı ve Apple’ın daha iyi bir sesli asistan ürettiğini ancak öyle olmadığını ilan etti. Yapay zekaya yönelik heyecanın gerçek teknolojiden çok daha hızlı ilerlemeye devam etmesi nedeniyle aynı şey şimdi de geçerli olabilir. Humane, Rabbit, Google ve diğerleri benzer fikirler üzerinde çalışıyorlar – “ajan” yapay zeka dünyasında yaz mevsiminin moda kelimesi – ve henüz kimse bunun hazır olduğunu kanıtlamadı.

Ancak Apple burada bir şeyi çözmüşse, bu, gerçek Siri’yi, yıllar önce bize söz verilen Siri’yi ilk kez görme şansımız olabilir. Belki bir sonraki reklamda Deschanel’in domates çorbası sihirli bir şekilde evinde belirir ve Headspace uygulaması Malkovich’e biraz iç huzur getirmek için devreye girer. Belki sonunda Apple’ın her zaman yapmak istediği Siri’yi elde ederiz.



genel-2

Popular Articles

Latest Articles