欄目： IT新聞

中國AI公司DeepSeek新模型「MODEL1」曝光

2026 年 1 月 21 日下午 7:00

中國AI公司DeepSeek新模型「MODEL1」曝光

21日，DeepSeek官方GitHub倉庫更新了一系列FlashMLA代碼，藉助AI對全部總代碼文件數:114個（包括.py, .md, .txt, .sh, .cpp, .cu, .h文件）進行分析，發現了一個此前未公開的模型架構標識「MODEL1」，共被提及31次。MODEL1是DeepSeek FlashMLA中支持的兩個主要模型架構之一，另一個是 DeepSeek -V3.2。據推測，MODEL1很可能是一個高效推理模型，相比V3.2，內存佔用更低，適合邊緣設備或成本敏感場景。它也可能是一個長序列專家，針對 16K+ 序列優化，適合文檔理解、代碼分析等長上下文任務。此前媒體爆料，DeepSeek將在今年2月中旬農曆新年期間推出新一代旗艦AI模型——DeepSeek V4，將具備更強的寫代碼能力。

—— 科創板日報

🔥免費PC翻牆、安卓VPN翻牆APP
🔥靈魂之謎|中華文化|治國大道

轉自: 風向旗快訊

喜歡、支持，請轉發分享↓禁聞網責任編輯：趙凌雲

贊助商鏈接

王彬彬：瞿秋白的不得不走、不得不留與不得不死
作者：陳群2019，文章內容並…

預言背後的真相
文：小於從古至今，世間流傳著…
伊朗政權覆滅倒計時⑤⑥：美國制裁中國民營煉油巨頭，查扣伊朗巨額虛擬貨幣
來源: 悉尼奶爸 Sydney…
紅果短劇發布 5 億元真人短劇扶持計劃
紅果短劇發布 5 億元真人短劇…

中共回應無賴至極：「被扣伊朗貨輪有來自中國的禮物」
中國駛往伊朗的貨櫃輪圖斯卡號（…
2026年第一季度三退人數突破332萬
來源：全球退黨服務中心 202…
李金銓：報人情懷與國家想像——《報人報國》代序
轉自：作者：李金銓，文章內容並…
真的要變朝鮮？下載美劇違法了？
走向朝鮮的又一個重大標誌性步驟…
裴敏欣：中國夢碎，改革開放究竟為中國留下了什麼？
轉自：季風書園 JF Book…

標籤： DeepSeekGitHub中國農曆新年科創板