Mistral, Açık Kaynakta 8X22B Uzman Karması Yapay Zeka Modelini Başlattı, Karşılaştırmalar Büyük Yükseltmeleri Ortaya Çıkardı - kilalu.blog

Mistral, en son yapay zeka (AI) modeli olan 8X22B’yi Çarşamba günü piyasaya sürdü. Uzmanlardan oluşan karma yapay zeka modeli, Aralık 2023’te piyasaya sürülen 8X7B modelini takip ediyor ve daha büyük bir parametre boyutu sunuyor. Tamamen açık kaynaklı yapay zeka modelleriyle tanınan şirket, son modeli alışılmadık bir şekilde, herhangi bir duyuru veya blog yazısı olmadan piyasaya sürdü. AI firmasının kendisi tarafından sağlanan herhangi bir kıyaslama olmasa da Hugging Face topluluğu kullanıcıları bunu test etti ve 8X22B modelinin kıyaslama puanlarını yayınladı. Sonuçlar, OpenAI ve Google’ın kapalı modelleriyle aradaki farkı kapatıyor gibi görünüyor.

Mistral’ın resmi X (eski adıyla Twitter) hesabı piyasaya sürülmüş 8X22B AI modelini bir torrent mıknatısı bağlantısı aracılığıyla, AI modellerini duyuru yapmadan ve doğrudan insanların indirmesine yönelik alışılmadık yöntemini sürdürüyor. Mistral aynı zamanda sadece ağırlıkları değil aynı zamanda tüm mimariyi de açık hale getiren tek gerçek açık kaynaklı platformlardan biridir. Ancak çoğu cihazın güçlü AI modellerini cihaz üzerinde çalıştıracak donanıma sahip olmadığını ve bunun cihazın arızalanmasına neden olabileceğini unutmamak gerekir. Toplam dosya boyutu 262GB’tır.

Mistral’ın 8X22B’si otomatik tamamlamalı bir yapay zeka modelidir. Bunlar genellikle AI modellerinin talimat verme veya sohbet varyantlarından farklıdır. OpenAI’nin ChatGPT’si ve Google’ın Gemini AI’si sohbet modelleri iken Meta’nın Code Llama 7B ve 13B’si talimat modelleridir. Sohbet modelleri, doğru yanıtı sağlamak için doğal dili ve bağlamsal sorguları anlayabilen modellerdir. Talimat modelleri çoğunlukla yapay zeka modelinden belirli bir görevi gerçekleştirmesini isteyen geliştiriciler tarafından kullanılır. Buna karşılık, otomatik tamamlama modeli, bilgi isteminde sağlanan cümleyi tamamlar.

Sarılma Yüzünü temel alan erken kıyaslama puanları topluluk gönderisi en son Mistral modelinin öncüllerine göre önemli iyileştirmeler sunduğunu ve diğer büyük modellerle aradaki farkı kapattığını gösteriyor. Hellaswag değerlendirmesinde Mistral 8X22B 88,9 puan alarak GPT-4’ü 95,3 puanla, Claude 3 Opus’u 95,4 puanla ve Gemini 1.5 Pro’yu 92,5 puanla yakından takip etti. Ancak GPT-3.5’i 85.5 puanla ve Gemini 1.0 Ultra’yı 87.8 puanla geride bırakıyor.

Karşılaştırma ölçütleri Mistral’in kendi modelleriyle karşılaştırıldığında 8X22B, Mistral-orta ve Mistral-büyük modeller arasında yer almaktadır. Talimat veya sohbet varyantının daha sonraki bir sürümüyle Mistral-large’e benzer bir performans gösterebilir.