據(jù)路透社報(bào)道,國(guó)內(nèi)AI大模型公司DeepSeek正與投資者洽談首輪外部股權(quán)融資,計(jì)劃以不低于100億美元的估值,募集不少于3億美元資金。若消息屬實(shí),這將是DeepSeek成立以來的首次外部融資。此前,該公司依托幻方量化的內(nèi)部支持,曾多次拒絕中國(guó)頭部風(fēng)投機(jī)構(gòu)與科技巨頭的投資邀約。
業(yè)內(nèi)人士分析,此次融資或與其核心人才流失及下一代模型V4研發(fā)壓力有關(guān)。據(jù)多方信息顯示,2025年下半年以來,DeepSeek已流失至少5名核心研發(fā)成員,覆蓋基座模型、推理、OCR、多模態(tài)等關(guān)鍵技術(shù)方向。其中,多模態(tài)模型核心貢獻(xiàn)者阮翀加盟自動(dòng)駕駛公司元戎啟行出任首席科學(xué)家,第一代大語言模型核心作者王炳宣已加入騰訊,R1核心研究員郭達(dá)雅確認(rèn)加入字節(jié)跳動(dòng)Seed團(tuán)隊(duì),V3核心貢獻(xiàn)者羅福莉則加入小米MiMo團(tuán)隊(duì)。郭達(dá)雅為GRPO算法的主要貢獻(xiàn)者,該算法是DeepSeek-R1推理能力訓(xùn)練方法論的核心。
據(jù)業(yè)內(nèi)人士透露,DeepSeek薪資在業(yè)內(nèi)處于中等水平,而獵頭正以2至3倍的高薪和期權(quán)加速挖角其團(tuán)隊(duì)成員。
在技術(shù)更新方面,DeepSeek于4月8日在最新版本中新增“快速模式”與“專家模式”,首次在官網(wǎng)引入分層模式。業(yè)內(nèi)預(yù)期DeepSeek有望在4月正式上線V4版本,該模型預(yù)計(jì)采用Mega MoE架構(gòu),參數(shù)規(guī)?;蜻_(dá)1.6萬億。但有分析指出,核心人才流失可能對(duì)V4的發(fā)布節(jié)奏造成沖擊。
編輯:?jiǎn)涕?/p>