
DeepSeek’i özel yapan şey, görünüşe göre çok daha ucuz olmasıdır. Endüstri lideri OpenAI’nin GPT-4’ün geliştirilmesi için 100 milyon dolardan fazla harcadığı bildirilirken , DeepSeek modelini 6 milyon dolardan geliştirdi. Bu maliyet avantajı, üst düzey Nvidia A100 yongalarının diğer nispeten daha ucuz işlemcilerle birlikte kullanılmasıyla elde edildi.
Uzmanlar , bu rakamın yanıltıcı olduğunu çünkü daha geniş araştırma ve geliştirme maliyetlerini, veri toplamayı, personel giderlerini, altyapı maliyetlerini ve donanım yatırımlarını hesaba katmadığını savunuyorlar.
Performans ve Özellikler
Tıpkı ChatGPT gibi, DeepSeek de sorulara yanıtlar sağlayarak çalışır ve matematik ve kodlamada OpenAI’nin o1 modeliyle karşılaştırılabilir. İnsanlar gibi düşünen ve yanıt veren bir ‘akıl yürütme’ modelidir, bu da onu özellikle iş ve müşteri hizmetleri amaçları için yararlı kılar.

Performance compared Source: Artificial Analysis Graphic: Jasmine Cui and Joe Murphy / NBC News
Sistem, akıl yürütme sürecini adımlara ayırarak bir sorunu çözmede akıl yürütme sürecini göstermede özellikle iyidir. Ayrıca, bir bulmacayı çözen bir insan gibi, mantığında geriye doğru izleyebilir ve gerekirse önceki adımları düzeltebilir.
Bu şeffaf yaklaşım, kullanıcıların önerilerini nasıl bulduğunu bilmelerini sağlar.
DeepSeek Etik Kaygıları Artırıyor
DeepSeek’in yapay zeka ortamındaki yükselişi, özellikle ABD ihracat kontrollerini kırmak için geliştirilmiş olabilecek pahalı donanımların omurgası üzerinde eğitildiği göz önüne alındığında, teknolojisinin sonuçları hakkında önemli soruları gündeme getiriyor.
OpenAI’nin o1’inin işlevselliğini kopyalayabilen ancak maliyetin çok altında olan R1 modelinin performansı etkileyici olsa da, dünyanın geri kalanında yapay zekanın geliştirilmesinde izlenmeyen veya etik olmayan uygulamaların olasılığını da ortaya koyuyor.
Şirketin, daha önce ABD düzenlemeleri tarafından kısıtlanan Nvidia A100 yongalarını başarılı bir şekilde dahil etme kapasitesi, şirketin gerçekliği ve bu tür teknolojilerin uluslararası düzeni bozmak için nasıl kullanılabileceği konusunda bir kırmızı bayraktır.
Dahası, DeepSeek’in hassas tarihi olaylara verdiği yanıtların Çin hükümetinin sansürüne uygunluğu endişe vericidir, çünkü modelin, modelin küresel olarak kullanışlılığını ve güvenilirliğini sınırlayabilecek devlet kontrollü anlatıları desteklemek için kullanılabileceğini göstermektedir.
Bu nedenle, piyasalar Amerikan teknolojik üstünlüğüne yönelik bu algılanan tehdide yanıt verirken, DeepSeek’in stratejisinin daha geniş etkilerinin – yenilikçi ancak ahlaki açıdan sağlam – kapsamlı bir şekilde analiz edilmesi gerekiyor.