Elon Musk'ın yapay zeka şirketi xAI, son amiral gemisi modeli Grok 3'ü, iOS ve web için Grok uygulamalarındaki yeni yeteneklerle birlikte pazartesi gecesi geç saatlerde piyasaya sürdü.

OpenAI'nin GPT-4o ve Google'ın Gemini gibi modellere cevabı olan xAI'nin Grok'u, görüntüleri analiz edebiliyor, sorulara yanıt verebiliyor ve Musk'ın sosyal ağı X'teki bir dizi özelliği destekliyor. Birkaç aydır geliştirilmekte olan Grok 3'ün iyimser bir şekilde 2024'te piyasaya sürülmesi planlanmıştı, ancak bu son tarihi kaçırdı.

xAI, Grok 3'ü eğitmek için Memphis'teki devasa bir veri merkezini kullanıyordu; yaklaşık 200.000 GPU içeren bir veri merkezi. Musk, X'teki bir gönderide, Grok 3'ün selefi Grok 2'den "10 kat" daha fazla işlem gücüyle ve mahkeme davalarından alınan dosyaları içeren genişletilmiş bir eğitim veri setiyle geliştirildiğini iddia etti.

Lansman yapıldı

Musk, Pazartesi günü canlı yayınlanan bir sunumda "Grok 3, Grok 2'den bir kat daha yetenekli" dedi. "Bu, bazen politik olarak doğru olanla çelişse bile, azami ölçüde gerçeği arayan bir yapay zeka. Grok 3, daha kesin olmak gerekirse, bir model ailesidir; sadece bir model değil. Grok 3'ün daha küçük bir versiyonu olan Grok 3 mini, bir miktar doğruluk pahasına sorulara daha hızlı yanıt veriyor. Henüz tüm modeller mevcut değil (ve bazıları beta aşamasında) ancak lansman Pazartesi günü başladı." dedi.

Teknolojinin yeni tehdidi: Yapay zeka sevgili! Teknolojinin yeni tehdidi: Yapay zeka sevgili!

xAI, Grok 3'ün, bir modelin performansını bir matematik sorusu örneğinde değerlendiren AIME ve modelleri doktora düzeyinde fizik, biyoloji ve kimya problemleri kullanarak değerlendiren GPQA gibi kıyaslamalarda GPT-4o'yu geçtiğini iddia ediyor. xAI'ye göre, Grok 3'ün erken bir versiyonu, farklı AI modellerini birbirleriyle karşılaştıran ve kullanıcıların tercih ettikleri yanıtlar için oy kullandığı kalabalık kaynaklı bir test olan Chatbot Arena'da da rekabetçi bir puan aldı.

Grok 3'ün iki çeşidi olan Grok 3 Reasoning ve Grok 3 mini Reasoning, OpenAI'nin o3-mini ve Çinli AI şirketi DeepSeek'in R1'i gibi "akıl yürütme" modellerine benzer şekilde sorunları dikkatlice "düşünebilir". Akıl yürütme modelleri, sonuçları vermeden önce kendilerini iyice gerçek kontrolünden geçirir, bu da normalde modelleri tökezleten bazı tuzaklardan kaçınmalarına yardımcı olur.

Muhakeme modelleri

Muhakeme modellerine Grok uygulaması üzerinden erişilebilir. Kullanıcılar Grok 3'ten "Düşünmesini" isteyebilir veya daha zor sorgular için ek hesaplama kullanan muhakeme için "Büyük Beyin" modunu kullanabilir. xAI, muhakeme modellerini; matematik, bilim ve programlama ile ilgili sorular için en uygun modeller olarak tanımlıyor.

Bloomberg'de yer alan habere göre; Musk, Grok uygulamasında muhakeme modellerinin bazılarının "düşüncelerinin", AI modeli geliştiricilerinin başka bir modelden bilgi çıkarmak için kullandığı bir yöntem olan damıtmayı önlemek için gizlendiğini söyledi. Son zamanlarda DeepSeek, kendi modelini oluşturmak için OpenAI'nin modellerini damıtmakla suçlandı.

Grok'un muhakeme modelleri, xAI'nin OpenAI'nin derin araştırması gibi AI destekli "derin araştırma" araçlarına cevabı olan DeepSearch adlı Grok uygulamasındaki yeni bir özelliğin temelini oluşturuyor. DeepSearch, bilgileri analiz etmek ve bir soruya yanıt olarak bir özet sunmak için interneti ve X'i tarar.

SuperGrok aylık 30 dolar

X'in Premium+ katmanına abone olanlar önce Grok 3'ü alacak ve diğer özellikler xAI'nin SuperGrok adını verdiği yeni bir planın arkasında kapalı. Aylık 30$ veya yıllık 300$ fiyatlandırılan SuperGrok, ek muhakeme ve DeepSearch sorgularının kilidini açıyor ve sınırsız görüntü üretimi sağlıyor.

Musk, gelecekte - yaklaşık bir hafta sonra - Grok uygulamasının Grok modellerine sentezlenmiş bir ses verecek bir "ses modu" kazanacağını söyledi. Birkaç hafta sonra, Grok 3 modelleri DeepSearch özelliğiyle birlikte xAI'nin kurumsal API'sine gelecek. Musk, bundan birkaç ay sonra xAI'nin Grok 2'yi açık kaynaklı hale getireceğini söyledi.

Musk, "Genel yaklaşımımız, bir sonraki sürüm tamamen çıktığında son sürümü [Grok'un] açık kaynaklı hale getirmektir," dedi. "Grok 3 olgunlaştığında ve kararlı hale geldiğinde, ki bu muhtemelen birkaç ay içinde olacaktır, o zaman Grok 2'yi açık kaynaklı hale getireceğiz."

"Grok 3 politik olarak daha tarafsız"

Musk, Grok'u yaklaşık iki yıl önce duyurduğunda, yapay zekayı keskin, filtresiz ve "uyanık" karşıtı olarak tanıttı; genel olarak, diğer yapay zeka sistemlerinin cevaplamayacağı tartışmalı soruları cevaplamaya istekliydi. Bu vaadin bir kısmını yerine getirdi. Örneğin, kaba olmaları söylendiğinde, Grok ve Grok 2 memnuniyetle kabul ederdi ve ChatGPT'den muhtemelen duymayacağınız renkli bir dil kullanırdı.

Ancak Grok 3'ten önceki Grok modelleri politik konulardan kaçınıyordu ve belirli sınırları aşmıyordu. Aslında, bir çalışma Grok'un transgender hakları, çeşitlilik programları ve eşitsizlik gibi konularda politik sola meyilli olduğunu buldu.

Musk, bu davranışın sorumlusunun Grok'un eğitim verileri (kamuya açık web sayfaları) olduğunu söyledi ve "Grok'u politik olarak tarafsızlığa yaklaştıracağını" taahhüt etti. xAI'ın bu hedefe ulaşıp ulaşmadığı henüz belli değil.

Kaynak: Haber Merkezi