交流評論、關注點贊

  • Facebook Icon臉書專頁
  • telegram Icon粉絲交流群
  • telegram Icon電報頻道
  • RSS訂閱禁聞RSS/FEED訂閱

中國AI公司DeepSeek新模型「MODEL1」曝光

2026年01月21日 19:00 PDF版 分享轉發

中國AI公司新模型「MODEL1」曝光

21日,DeepSeek官方倉庫更新了一系列FlashMLA代碼,藉助AI對全部總代碼文件數:114個(包括.py, .md, .txt, .sh, .cpp, .cu, .h文件)進行分析,發現了一個此前未公開的模型架構標識 「MODEL1」,共被提及31次。MODEL1是DeepSeek FlashMLA中支持的兩個主要模型架構之一,另一個是 DeepSeek -V3.2。據推測,MODEL1很可能是一個高效推理模型,相比V3.2,內存佔用更低,適合邊緣設備或成本敏感場景。它也可能是一個長序列專家,針對 16K+ 序列優化,適合文檔理解、代碼分析等長上下文任務。此前媒體爆料,DeepSeek將在今年2月中旬期間推出新一代旗艦AI模型——DeepSeek V4,將具備更強的寫代碼能力。

—— 科創板日報

轉自: 風向旗快訊

請點贊轉發分享👇👇👇Follow Us 責任編輯:趙凌雲