DeepSeek 發布視覺基元推理報告,解決多模態 Reference Gap
2026年04月30日 20:00 PDF版
DeepSeek 發布視覺基元推理報告,解決多模態 Reference Gap
2026 年 4 月 30 日,DeepSeek 公開技術報告《Thinking with Visual Primitives》,提出將點、框等視覺基元作為思維最小單元交錯嵌入推理鏈,解決複雜結構推理中的 Reference Gap。方法基於 DeepSeek-V4-Flash 架構,壓縮 KV 緩存,以極低圖像 token 消耗完成推理。在計數和空間推理基準上,該模型性能與 GPT-5.4、Claude-Sonnet-4.6、Gemini-3-Flash 相當(論文強調僅覆蓋部分相關維度,不代表整體能力)。未來將開源內部基準、部分冷啟動數據,權重將整合至基礎模型后發布。
- 🔥免費PC翻牆、安卓VPN翻牆APP
- 🔥靈魂之謎|中華文化|治國大道
請點贊轉發分享👇👇👇Follow Us 責任編輯:喬楓


臉書專頁
粉絲交流群