ANALİZ
DeepSeek’in Hikayesi: Silikon Vadisi Kadar Pekin İçin de Bir Meydan Okuma!
DeepSeek'in başarıları, Çin'in hükümet destekli sayısız araştırma enstitüsünden veya devlet kontrolündeki şirketlerden birinden çıkmadı. Liang, DeepSeek'teki hisselerin çoğunu kontrol ediyor ve Çin'in devlet tarafından yönetilen girişim sermayesi sektöründen uzak duruyor.
SON YAPAY ZEKA (AI) modelinin piyasaya sürülmesiyle, bilinmeyen bir Çin firması olan DeepSeek, Çin inovasyonunu engellemeyi amaçlayan birkaç yıllık Amerikan politikasını yerle bir etti. Bu süreçte, Amerika'nın AI çip şampiyonu Nvidia'dan, veri merkezlerinde kullanılan elektrikli ekipman üreticisi Siemens Energy'ye kadar uzanan kritik şirketlerin değerlemelerinde bir delik açtı. DeepSeek, Amerikan ihracat kısıtlamaları etrafında yenilik yapma yeteneğini gösterirken, AI modellerini eğitme konusunda son teknoloji yarı iletken çiplere erişimin, düşünüldüğü kadar önemli olup olmadığı konusunda şüphe uyandırdı.
Her şeyin merkezindeki isim, DeepSeek'in 40 yaşındaki kurucusu Liang Wenfeng. Oluşturduğu küresel piyasa çalkantısından ne kadar keyif aldığı belirsiz. Yakın zamanda yerel medyaya konuşan liseden bir sınıf arkadaşı, Liang'ın 29 Ocak'ta başlayan Çin yeni yılı için memleketinde saklandığını söyledi. Çin sosyal medyasında zayıf ve solgun görünümü nedeniyle alay konusu olan Liang, çoğu insan için bir gizem olmaya devam ediyor. DeepSeek ile profesyonel ilişkileri olanlar, onun insan benzeri genel yapay zeka (AGI) ve bunun dünya üzerinde yaratabileceği etkiler konusunda takıntılı olduğunu söylüyor. DeepSeek'in kurucusu, bu arayışıyla hem Batı'da hem de Çin'de teknolojik ilerleme hakkındaki fikirleri altüst ediyor.
Liang hakkında kamuya açık bilgiler yetersiz. 1985 yılında güneydeki Zhanjiang şehrinin yakınlarındaki yoksul bir köyde öğretmen bir ailenin çocuğu olarak doğdu, yetenekli bir öğrenciydi. Eski bir öğretmen, onun ortaokul sıralarındayken üniversite düzeyinde matematikte ustalaştığını iddia ediyor. 2002 yılında doğudaki Hangzhou şehrindeki prestijli bir okul olan Zhejiang Üniversitesi'nde elektronik bilgi bölümüne girdi. Aynı üniversitede tanınmış bir makine görüş bilimcisinin gözetiminde aldığı yüksek lisans derecesi, onu yapay zeka alanına yöneltti.
O zamanlar Hangzhou, internet teknolojisi için hareketli bir merkezdi ve e-ticaret sitesi olan Alibaba gibi yükselen şirketlere ev sahipliği yapıyordu. Liang ve birkaç sınıf arkadaşı şehre yerleşti ve yığınla veriyi analiz etmeye dayanan niceliksel yatırım modellerini denemeye başladı. 2013 yılında Liang ve üç sınıf arkadaşı, inşa ettikleri ticaret modellerini paraya çevirmek amacıyla Yakebi adlı bir yatırım grubu kurdu.
İki yıl sonra Liang, Çin'de deragülasyon ve piyasa oynaklığı döneminde düzinelerce benzer firma ile birlikte hızla büyüyen niceliksel bir hedge fonu olan High-Flyer'ı kurdu. 2021'de 100 milyar yuan’lık (14 milyar $) bir sermayeyi yönettiğini iddia etse de o yılın ikinci yarısında hızla küçüldü. Sektördekiler High-Flyer'ın en agresif quant fonlarından biri olarak isim yaptığını ve düzenli olarak Çinli menkul kıymet düzenleyicilerinin öfkesini çektiğini söylüyor.
DeepSeek'in kökenleri High-Flyer'ın algoritmalarını geliştirme çabasına dayanıyor. 2019'da firma, "Fire-Flyer 1" adlı kendi derin öğrenme platformunu geliştirmek için ayrı bir birim kurmak üzere 200 milyon yuan yatırım yaptı. Fon, 2021'de 10.000 Nvidia A100 grafik işleme çipleriyle donatılmış ikinci bir hamle için 1 milyar yuan yatırdı. Bu, High-Flyer'ı bir istisna haline getirdi: O zamanlar Çin'de (hepsi de Alibaba gibi teknoloji devleri olan) sadece dört firma, bu kadar büyük güçlü çip cephaneliklerine sahipti. DeepSeek, 2023'te bağımsız bir şirket haline getirildi.
DeepSeek, geçtiğimiz yılın mayıs ayında, V2 modeline dayalı ultra ucuz bir sohbet robotunu piyasaya sürdüğünde piyasaya ilk darbeyi indirdi. Bu, Çin'in yapay zeka endüstrisinde bir fiyat savaşını başlattı ve ülkenin en büyük teknoloji firmalarını (Alibaba, Baidu, ByteDance ve Tencent) fiyat düşürmeye zorladı.
DeepSeek ya da derin düşünceler
Liang’a göre, daha az hesaplama gücü kullanan modeller geliştirmek, uzun vadeli hedefinin peşinde önemli bir adımdı. Yerel medyaya, "Amacımız, sınırlı kaynaklar dahilinde üstün yetenekler elde etmek için yeni model yapıları keşfetmemizi gerektiren AGI'dir" dedi.
Batı'yı şok eden DeepSeek'in yeni R1 modeli, ilerleme kaydettiğini gösteriyor. Şirket, eğitim maliyetinin 6 milyon dolardan az olduğunu, ChatGPT'nin üreticisi OpenAI gibi firmaların karşılaştırılabilir modellerinin çok küçük bir kısmını oluşturduğunu söylüyor. OpenAI'nın patronu Sam Altman, R1'i "etkileyici" olarak nitelendirdi (ancak "çok daha iyi modeller" üretme sözü de verdi ve "yeni bir rakiple karşılaşmanın gerçekten canlandırıcı" olduğunu ekledi).
DeepSeek'le ilgili keskin bir şüpheye sahip olanlar da var. İlk testler, R1 modelinin, firmanın söylediği kadar güçlü olduğunu doğruluyor gibi. Ancak bazıları, firmanın modeli geliştirmek için kullandığı üst düzey çiplerin sayısını az gösterip göstermediğini sorguluyor. Ayrıca DeepSeek'in modellerini, "damıtma" olarak bilinen bir işlem olan Amerikan modellerinin sonuçlarını inceleyerek eğittiği yönünde spekülasyonlar da var. OpenAI, DeepSeek'in hizmet şartlarını ihlal ederek modellerini damıttığına işaret eden kanıtlara sahip olduğunu öne sürdü.
DeepSeek'in verimlilik kazanımları düşünüldüğü kadar etkileyici olmasa bile, hem Silikon Vadisi'nde hem de Pekin'de düşünmeye meydan okuyor. Çin devlet medyası, ülkenin yapay zeka üstünlüğü mücadelesinde DeepSeek'i ulusal bir varlık olarak savunmakta gecikmedi. Liang, 20 Ocak'ta diğer birkaç girişimciyle birlikte Çin Başbakanı Li Qiang ile görüşmeye davet edildi.
Ancak bir yatırım şirketi olan Pinpoint Asset Management'tan Zhang Zhiwei'nin de belirttiği gibi, DeepSeek'in başarıları Çin'in sayısız hükümet destekli araştırma enstitüsünden veya devlet kontrolündeki şirketlerden birinden çıkmadı. Liang, DeepSeek'teki hisselerin çoğunu kontrol ediyor ve Çin'in devlet tarafından yönetilen girişim sermayesi sektöründen uzak duruyor.
Bu arada birçok Çinli AI şirketi, uygulamalarının temeli olarak Amerikan sosyal medya firması Meta tarafından geliştirilen büyük dil modelleri ailesi olan Llama'yı kullanıyor.
Liang, Çin'in son 30 yıldaki rolünü Batı'da geliştirilen temeller üzerine inşa edilen bir teknolojik "takipçilik" olarak görüyor. Temmuz ayında yerel medyaya verdiği bir röportajda, Amerika ile Çin arasındaki farkın "özgünlük ve taklit" arasında olduğunu söyledi. Nvidia'nın başarısının, yalnızca kendi performansına değil, aynı zamanda Batılı şirketler arasındaki teknolojik işbirliğine de dayandığını savunuyor. Liang’a göre Çin'in Batı'nın bilgi işlem gücünü taklit etme çabaları yetersiz düzeyde. Çünkü devlet öncülüğünde sermaye yoğun bir çabaya rağmen bu tür bir işbirliğinden yoksun durumda. Şimdi DeepSeek yalnızca Silikon Vadisi için değil, aynı zamanda Pekin'deki Çin liderleri için de bir uyarı niteliğinde olabilir.
Bu yazı The Economist’te 29 Ocak 2025 tarihinde “DeepSeek poses a challenge to Beijing as much as to Silicon Valley” başlığıyla yayınlandı. Çeviride editoryal düzenleme yapılmıştır.