DeepSeek-R1 是一個專注於推理的大型語言模型,專門設計用於處理數學、編程和一般推理的複雜任務。該模型使用大規模強化學習進行訓練,無需初始監督微調,展現出卓越的推理能力。
在需要密集推理的任務中,該模型表現出色,在各種基準測試中達到與 OpenAI 的 o1 模型相當的性能。它支援數學問題解決、程式碼生成和一般推理,可應用於教育工具、程式設計輔助和研究。
作為 MIT 授權的開源模型,DeepSeek-R1 允許社群貢獻和商業使用,使開發者和研究人員更容易獲得先進的 AI 功能。
探索我們的 AI 模型能力