霸气拿下!DeepSeek 新推理模型 R1-Lite 横空出世,OpenAI o1 有对手了!
刚刚,DeepSeek 官方宣布,全新研发的推理模型 DeepSeek-R1-Lite 预览版正式上线。这款号称媲美 OpenAI o1-preview 的 AI 大模型,一经亮相就引发业界热议。
数理双优生,这次是真的行
别看它名字里带个”Lite”,这款模型的实力可一点都不”轻量”。据官方透露,DeepSeek R1 系列模型采用强化学习训练,推理过程包含大量反思和验证,思维链长度可达数万字。在数学、代码以及各种复杂逻辑推理任务上,R1-Lite 展现出了与 OpenAI o1-preview 不相上下的推理能力。更让人惊喜的是,它还为用户呈现了 o1 没有公开的完整思考过程,这波操作可以说是相当透明了。
那么,R1-Lite 到底有多强?来看看它的战绩就知道了:
在美国数学竞赛(AMC)中难度最高的 AIME 测试中,R1-Lite 轻松超越了 GPT-4 等知名模型。不仅如此,它在全球顶级编程竞赛(codeforces)等评测中也是一骑绝尘。这些成绩足以证明,R1-Lite 在处理高难度数学问题和复杂编程任务时,已经达到了相当高的水平。
这个思维链能有多长?
R1-Lite 的与众不同之处在于它的”深思熟虑”。模型在给出答案前,会进行长时间的推理、反思和验证。有意思的是,官方还放出了一张图表,显示模型在数学竞赛上的得分与允许思考的长度紧密相关。换句话说,给它更多时间思考,它就能拿出更好的成绩。这种”深思熟虑”的能力,不正是我们人类引以为傲的特质吗?
不过,目前这款模型还处于迭代开发阶段,仅支持网页使用,暂不支持 API 调用。 DeepSeek 官方表示,R1-Lite 使用的是一个较小的基座模型,还无法完全释放长思维链的潜力。言外之意,未来还有更强大的版本等着我们?
写在最后
据透露,正式版 DeepSeek-R1 模型将完全开源,并公开技术报告和部署 API 服务。这个消息无疑让开发者和研究人员兴奋不已。开源意味着更多人可以参与到模型的改进中来,也意味着 AI 技术将更加透明和可信。
值得一提的是,DeepSeek 作为 High-Flyer 资本管理公司的 AI 研究分支,此次推出 R1 系列推理模型,不仅是为了在技术上与 OpenAI 一较高下,更是为了支持学术研究,促进 AI 的多样化应用。这种开放共享的态度,着实让人眼前一亮。
对于普通用户来说,现在就可以通过 DeepSeek Chat 免费体验 R1-Lite 的强大功能了。非付费用户每日消息数有限哦!