DeepSeek于2025年12月1日同時發布兩個正式版模型DeepSeekV3.2和DeepSeek-V3.2Speciale。這一舉措旨在覆蓋日常應用與極致推理場景,滿足不同用戶需求,推動技術邊界拓展與開源生態發展。以下為具體分析。
·發布背景與動機技術迭代需求。隨著人工智能技術的快速發展,用戶對模型性能的需求日益多樣化。DeepSeek通過同時發布兩個版本,旨在滿足不同場景下的需求,提升用戶體驗。
·市場策略考量。通過提供不同定位的模型,DeepSeek能夠覆蓋更廣泛的用戶群體,從日常應用到專業研究,增強市場競爭力。
·技術探索與突破。DeepSeek-V3.2Speciale作為長思考增強版,結合了DeepSeek-Math-V2的定理證明能力,旨在探索模型能力的邊界,推動開源模型推理能力的極致化。模型特點與定位DeepSeekV3.2目標:平衡推理能力與輸出長度,適合日常使用。
性能:在公開的推理類Benchmark測試中達到了GPT-5的水平,僅略低于Gemini-3.0-Pro。相比Kimi-K2-Thinking,V3.2的輸出長度大幅降低,顯著減少了計算開銷與用戶等待時間。應用場景:問答場景、通用Agent任務場景等。
DeepSeek-V3.2Speciale目標:將開源模型的推理能力推向極致,探索模型能力的邊界。性能:作為DeepSeek-V3.2的長思考增強版,結合了DeepSeek-Math-V2的定理證明能力,具備出色的指令跟隨、嚴謹的數學證明與邏輯驗證能力。在主流推理基準測試上的性能表現媲美Gemini-3.0-Pro。
特殊成就:成功斬獲IMO2025、CMO2025、ICPC WorldFinals2025及I012025金牌。應用場景:高度復雜任務、專業研究等領域影響與啟示。
