DeepSeek-V3.1于2025年8月21日正式发布,标志着DeepSeek在大模型领域的重要进展。此次发布的版本在多个方面进行了升级和优化,提升了模型的性能和用户体验。
主要升级内容:
混合推理架构:新模型支持思考模式与非思考模式的自由切换,用户可以通过“深度思考”按钮进行模式切换。
更高的思考效率:相比前代模型,DeepSeek-V3.1在回答问题时响应更快,任务表现更优。
更强的Agent能力:通过Post-Training优化,新模型在工具使用和智能体任务中的表现显著提升。
开源与开放平台:Base模型和后训练模型已开源至Hugging Face和魔搭平台,支持更广泛的开发者社区参与。
API接口升级:API接口支持128K上下文,新增Anthropic API格式支持,进一步提升了模型的灵活性和兼容性。
价格调整:DeepSeek计划于2025年9月6日起调整API调用价格,但9月6日前仍按原价格计费。
应用场景与影响:
DeepSeek-V3.1的发布不仅提升了模型在代码修复、多步推理、多学科任务中的表现,还为开发者和用户提供更高效、更准确的自然语言处理服务。该模型的发布标志着DeepSeek在大模型领域的进一步突破,为人工智能领域的发展提供了新的可能性。