ChatGPT’ye rakip oldu: DeepSeek nedir? DeepSeek nasıl kullanılır?

Yapay zeka geleceğin teknolojisini ve bugünü derinden etkiliyor. Yapay zeka dünyasında son vakitlerin en çok konuşulan ismi Çinli DeepSeek oldu. Peki, DeepSeek nedir? DeepSeek nasıl kullanılır?
DEEPSEEK NEDİR?
DeepSeek, Çin merkezli bir yapay zeka araştırma laboratuvarıdır ve açık kaynaklı büyük lisan modelleri (LLM) geliştirmeye odaklanmaktadır. Şirket, 2023 yılında, daha evvel High-Flyer isimli hedge fonunu kuran ve yöneten Liang Wenfeng tarafından kurulmuştur. High-Flyer, yapay zeka tabanlı ticaret algoritmaları geliştirmesiyle tanınan bir hedge fonudur.
Geliştirdiği Modeller:
DeepSeek Coder (Kasım 2023): Araştırmacılar ve ticari kullanıcılar için fiyatsız olarak sunulan bu model, bilhassa kodlama vazifelerine odaklanmıştır ve MIT lisansı altında açık kaynaklı olarak yayımlanmıştır.
DeepSeek LLM (Kasım 2023): 67 milyar parametreye sahip bu model, GPT-4 üzere başka büyük lisan modelleriyle rekabet edecek biçimde tasarlanmıştır. Lakin, hesaplama verimliliği ve ölçeklenebilirlik konusunda birtakım zorluklarla karşılaşmıştır. Bu modelin sohbet botu versiyonu olan DeepSeek Chat de piyasaya sürülmüştür.
DeepSeek-V2 (Mayıs 2024): Bu model, rakiplerine nazaran daha düşük bir maliyetle (milyon çıktı tokenı başına 2 RMB) piyasaya sürülmüştür. University of Waterloo Tiger Lab’ın sıralamasında yedinci sırada yer almıştır.
DeepSeek-V3 (Aralık 2024): 671 milyar parametreye sahip bu model, yaklaşık 55 gün süren bir eğitim süreciyle 5,58 milyon ABD dolarına mal olmuştur. 14,8 trilyon tokenlık bir data seti üzerinde eğitilmiştir ve Llama 3.1 ve Qwen 2.5 üzere modelleri geride bırakarak GPT-4o ve Claude 3.5 Sonnet ile muadil performans sergilemiştir.
DeepSeek R1-Lite-Preview (Kasım 2024): Mantıksal çıkarım, matematiksel akıl yürütme ve gerçek vakitli sorun çözme yeteneklerine sahip bu model, OpenAI’nin o1 modeline misal performans göstermiştir.