电子发烧友网报导(文/李弯弯)日前
,百度布局DeepSeek官方宣告DeepSeek-R1模型已完结小版别试晋级,腾讯当时版别为DeepSeek-R1-0528
。抢滩次日 ,百度布局DeepSeek-R1-0528正式在Hugging Face渠道开源。腾讯用户可经过官方网页
、抢滩App
、百度布局小程序进入对话界面后
,腾讯敞开“深度考虑”功用体会最新版别。抢滩A。百度布局PI。腾讯也已同步更新
,抢滩调用方法不变。百度布局
DeepSeek-R1-0528。腾讯编程 。抢滩才能提高最为明显。
DeepSeek-R1-0528依然以2024年12月发布的DeepSeek V3 Base模型为基座,经过在后练习过程中投入更多算力 ,明显提高了模型的思想深度与推理才能。
官方称
,在数学、编程与通用逻辑等多个基准测评中,DeepSeek-R1-0528取得了当时国内一切模型中名列前茅的优异成果,并且在全体体现上挨近其他世界顶尖模型,如Open
。AI。的o3 高版别与o4 mini模型、Google的Gemini-2.5-Pro等
。
在编程才能方面,DeepSeek-R1-0528才能的提高最为明显 。闻名
。代码测验渠道Live CodeBench显现
,新版别功用能够比美OpenAIo3模型的高版别
。据测验者反应
,DeepSeek-R1-0528能够一次性生成超千行无Bug代码
,且在HTML/CSS/JS动态交互完成(如气候卡片动画 、数据可视化)中愈加精准。别的,在
。模仿
。物理磕碰的编程使命中
,其体现优于一些其他模型 。它还能用。Python。编写将Word文档中的图片提取到固定途径的小程序
,在短时间内完结使命。
在杂乱推理使命中,DeepSeek-R1-0528的体现也有明显提高
。在AIME 2025测验中,新版模型的精确率从旧版的70%提高至87.5%。这一提高得益于模型在解题过程中进行了更为翔实和深化的考虑,旧版模型均匀每题运用12K tokens
,而新版模型均匀每题运用 23K tokens
。此外
,它还能正确答复“9.9 - 9.11 = ?”这类难倒其他顶流大模型的数字新难题。
在。构思。写作才能上,DeepSeek-R1-0528 输出的文本愈加天然 ,结构更有层次感 ,展示出了共同的推理风格,不只速度很快,并且进行了充沛的考虑。在旧版R1的基础上 ,DeepSeek-R1-0528 针对议论文
、小说
、散文等文体进行了进一步优化,能够输出篇幅更长、结构内容更完好的长篇著作,一起呈现出愈加靠近人类偏好的写作风格。
在其他才能方面
,如错觉改进,DeepSeek-R1-0528针对错觉问题进行了优化
。与旧版比较,更新后的模型在改写润饰、总结摘要、阅览了解等场景中 ,错觉率降低了45~50%左右,能够有效地供给更为精确、牢靠的成果。
此外 ,DeepSeek-R1-0528 还支撑东西调用功用,虽然不支撑在 thinking 中进行东西调用
,但在Tau-Bench测评中体现杰出,与OpenAI o1-high适当。API方面,DeepSeek-R1-0528已同步更新,接口。与调用方法坚持不变,但增加了Func。ti 。on Calling 和JsonOutput的支撑。
现在
,百度
。智能 。云千帆大模型渠道正式上架了DeepSeek最新的R1-0528大模型。千帆模型开发渠道同步支撑DeepSeek-R1最新版的批量推理、模型评价
、推理日志发掘剖析以及模型蒸馏功用,全流程东西链支撑企业构建自己的专属大模型;千帆运用开发渠道上的企业级RAG、Agent 、工作流
、百度AI查找组件等功用也完结对DeepSeek新模型全链路接入
,支撑企业根据DeepSeek-R1-0528定制专属运用 。文小言App也全面接入了DeepSeek最新模型