找回密码
 立即注册
搜索

迈向智能体时代"第一步" DeepSeek-V3.1 发布

[复制链接]
xinwen.mobi 发表于 2025-8-24 15:10:22 | 显示全部楼层 |阅读模式
2025年8月21日,DeepSeek正式发布DeepSeek-V3.1,官方称其为“迈向智能体时代第一步”。以下是关于DeepSeek-V3.1的详细介绍:模型架构与参数:DeepSeek-V3.1共有671B参数,激活参数37B,采用了混合推理架构,一个模型可同时支持推理模式和非推理模式,用户可通过官方App或网页端的“深度思考”按钮自由切换,在API接口中,deepseek - chat对应非思考模式,deepseek - reasoner对应思考模式,两者均支持128K上下文长度。性能提升:    推理效率更高:经过思维链压缩训练,V3.1-Think在输出token数减少20%-50%的情况下,各项任务的平均表现与前代模型DeepSeek-R1-0528持平,且响应速度更快。配合128K的上下文扩展和FP8精度推理,V3.1在工程层面强化了吞吐效率与能耗表现。    智能体能力更强:通过后训练优化,新模型在工具使用与智能体任务中的表现有较大提升。在代码修复和命令行任务等编程智能体场景中,能够在真实环境中完成多轮迭代修正,避免“越改越乱”的问题。在复杂搜索任务上,它可以规划搜索步骤、筛选证据并综合多源信息,在高难度的多学科题目测试中,性能已经远超前代模型。    编程能力突出:在AiderPolyglot多语言编程测试中,DeepSeek-V3.1获得71.6%的高分,超越了Claude 4 Opus等模型。在SVGBench基准测试中,其性能仅次于GPT-4.1-mini,远超DeepSeek R1。    多语言处理优化:DeepSeek-V3.1能处理超过100种语言,尤其对亚洲语言和资源较少语种的运用进行了优化。开源与生态:DeepSeek-V3.1的Base模型与后训练模型已在Hugging Face与魔搭平台开源,采用MIT许可证,允许商业使用与修改。此外,DeepSeek-V3.1增加了对Anthropic API格式的支持,用户可以轻松将DeepSeek-V3.1的能力接入其知名大模型Claude的编程框架。API价格调整:DeepSeek宣布从2025年9月6日凌晨起,对DeepSeek开放平台API接口调用价格进行调整并取消夜间时段优惠。调整后输入价格为缓存命中0.5元/百万tokens,缓存未命中4元/百万tokens;输出价格为12元/百万tokens。
回复

使用道具 举报

QQ|周边二手车|手机版|标签|新闻魔笔科技XinWen.MoBi - 海量语音新闻! ( 粤ICP备2024355322号-1|粤公网安备44090202001230号 )

GMT+8, 2025-12-18 07:26 , Processed in 0.074759 second(s), 18 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表