DeepSeek 和北京大學於 6 月 27 日發布 DSpark 論文,創辦人梁文鋒被列為作者。

根據 Guru Club 的消息,6 月 27 日,DeepSeek 團隊與北京大學發表了一篇研究論文,題為「DSpark: Confidence-Scheduled Speculative Decoding with Semi-Autoregressive Generation」。該論文引入了一個推測解碼模組,以優化現有模型 DeepSeek-V4-Pro 和 DeepSeek-V4-Flash 的推理效能。同時,團隊在 MIT 授權下開源了 DeepSpec,一個用於訓練和評估推測解碼草稿模型的完整程式碼庫。DeepSpec 目前支援三種實作:DSpark、DFlash 和 Eagle3。值得注意的是,DeepSeek 創辦人梁文鋒被列為論文作者。
免責聲明:本頁面資訊可能來自第三方來源,僅供參考,不代表 Gate 的立場或觀點,亦不構成任何財務、投資或法律建議。虛擬資產交易具有高風險,請勿僅依賴本頁資訊作出決策。詳情請參閱 免責聲明
回覆
0/400
ManeyToFuturevip
· 59分鐘前
衝啊 🔥
查看原文回復0