Çinli girişim DeepSeek, büyük modeller yerine kendi kurallarını kullanan yapay zekâ yöntemiyle GPT-4o ve Gemini’ye meydan okuyor.
Çinli girişim DeepSeek, büyük modeller yerine kendi kurallarını kullanan yapay zekâ yöntemiyle GPT-4o ve Gemini’ye meydan okuyor.
Çin merkezli yapay zekâ şirketi DeepSeek, büyük dil modellerine (LLM) yeni bir alternatif sunarak dikkatleri üzerine çekti. Şirketin geliştirdiği sistem, geleneksel olarak kullanılan dev yapay zekâ modelleri yerine, daha küçük yapılarla çoklu değerlendirme yöntemi kullanarak daha iyi sonuçlar elde etmeyi amaçlıyor.
Ocak ayında duyurulan yapay zekâ modeli R1 ve sohbet robotuyla büyük ilgi gören DeepSeek, ChatGPT’ye rakip bir sistem sunduğunu iddia etmişti. Şimdi ise şirket, daha düşük maliyetle daha yüksek doğruluk sağlayan yeni nesil bir teknolojiyi duyurdu.
Tsinghua Üniversitesi ile birlikte yürüttükleri çalışmada DeepSeek, "kendi ilkelerine dayalı eleştiri ayarı" (self-principled critique tuning - SPCT) adını verdiği yöntemi tanıttı. Bu sistemde yapay zekâ, içerikleri değerlendirmek için kendi kurallarını oluşturuyor ve ardından bu kurallara uygun olarak detaylı geri bildirimler sunuyor.
Bu yaklaşım, "üretken ödül modellemesi" (generative reward modeling - GRM) adı verilen bir sistemle destekleniyor. GRM, yapay zekânın verdiği yanıtları gerçek zamanlı olarak analiz eden entegre bir "yargıç" sistemiyle çalışıyor. Sistem, kullanıcıdan gelen soruya verilen cevabı değerlendiriyor ve hem modelin belirlediği kriterlerle hem de ideal bir yanıtla karşılaştırarak geri bildirim veriyor. Böylece model zamanla kendini geliştiriyor.
DeepSeek, bu teknolojiye "DeepSeek-GRM" adını verdi. Araştırmacılara göre bu yöntem, OpenAI’nin GPT-4o, Meta’nın Llama’sı ve Google’ın Gemini modeliyle rekabet edebilecek düzeyde performans sergiliyor.
Şirketin, bu gelişmiş teknolojiyi açık kaynak olarak sunmayı planladığı belirtiliyor ancak henüz kesin bir tarih açıklanmadı. Öte yandan, DeepSeek’in yeni nesil sohbet robotu R2’yi tanıtmaya hazırlandığına dair söylentiler de hızla yayılıyor. Şirket bu konuda resmi bir açıklama yapmasa da teknoloji dünyası bu duyuruyu merakla bekliyor.