您的位置: 首页 > 实时讯息 >

阿里发布最新开源推理模型,“性能比肩DeepSeek-R1”

0次浏览     发布时间:2025-03-07 00:20:00    

澎湃新闻记者 胡含嫣

阿里通义发布最新开源推理模型,称其性能比肩DeepSeek-R1。

3月6日凌晨,阿里巴巴正式发布最新的开源推理模型通义千问QwQ-32B。据介绍,通过大规模强化学习,千问QwQ-32B在数学、代码及通用能力上实现质的飞跃,整体性能比肩DeepSeek-R1,同时大幅降低了部署使用成本,在消费级显卡上也能实现本地部署。QwQ-32B采用了Apache 2.0开源协议,目前,所有人都可免费下载及商用QwQ-32B模型,或通过网页版Qwen Chat进行体验,该模型也将免费上架通义APP。

阿里通义团队表示,QwQ-32B模型拥有320亿参数,其性能可与具备6710亿参数(其中370亿被激活)的DeepSeek-R1媲美。在冷启动的基础上,模型针对数学和编程任务、通用能力分别进行了两轮大规模强化学习,在32B的模型尺寸上获得了令人惊喜的推理能力提升,印证了大规模强化学习可显著提高模型性能。

此外,QwQ-32B模型中还集成了与智能体(Agent)相关的能力,使其能够在使用工具的同时进行批判性思考,并根据环境反馈调整推理过程。

千问QwQ-32B既能提供极强的推理能力,又能满足更低的资源消耗需求,这背后的奥秘便在于强化学习(Reinforcement Learning)。阿里通义团队表示:“我们希望,我们的一点努力能够证明强大的基础模型叠加大规模强化学习也许是一条通往通用人工智能(AGI)的可行之路。”

在一系列权威基准测试中,千问QwQ-32B模型都表现出色,几乎完全超越了OpenAI去年9月发布的尺寸相近的o1-mini模型,比肩最强开源推理模型DeepSeek-R1:在测试数学能力的AIME24评测集上,以及评估代码能力的LiveCodeBench中,千问QwQ-32B表现与DeepSeek-R1相当,远胜于o1-mini及相同尺寸的R1蒸馏模型。

QwQ-32B模型和R1、OpenAI-o1-mini等知名模型的评分比较。来源:阿里通义

阿里通义团队表示,未来将继续探索将智能体与强化学习的集成,以实现长时推理,探索更高智能进而最终实现AGI的目标。

3月6日早盘,阿里巴巴集团(09988.HK)港股大幅高开涨超6%,截至午盘涨超7%。

此前,2月25日,阿里通义Qwen发布基于旗舰模型Qwen2.5-Max构建的推理模型QwQ-Max-Preview预览版,支持联网搜索,会和DeepSeek以及Kimi的推理模型一样展现思考过程,目前用户可在通义千问网页版进行体验。



本期编辑 邢潭


图片

相关文章

更强的235B来了!白山云已上线升级版Qwen3模型

导语:450元大模型API体验金,速领~7月22日,阿里千问宣布推出 Qwen3-235B-A22B-FP8 非思考模式(Non-thinking)的更新版本,命名为 Qwen3-235B-A22B-Instruct-2507-FP8。白山云科技已在第一时间火速完成部署上线,用户可通过访问“白山智算
2025-07-24 00:04:00

广西打造“超级接口”汇聚技术、市场与资源

图为南宁市一家企业的人工智能展厅。叶子榕摄(中经视觉)近来,位于广西南宁五象新区的中国—东盟人工智能创新合作中心(以下简称“南A中心”)吸引着无数关注的目光:今年以来已签约国内人工智能项目43个,涵盖算力算法研发、智算设备制造及智能体应用开发等领域;6月29日,首批16家东盟国家企业完成签约,人工智
2025-07-20 06:59:00

蒲白建庄矿业公司组织开展锻造卓越问题解决力专题宣讲

阳光讯(记者 高常生 通讯员 王丹)6月30日,蒲白建庄矿业公司在多功能厅以“四环节提升工作能力,五到位提升业务素质——锻造卓越问题解决力”为主题组织开展了专题培训,该公司领导班子成员,各部室、区队管理人员参加。深刻认识学习是成长进步的阶梯培训期间,该公司领导从学习的重要性、学习的现实意义、学习改变
2025-07-15 10:03:00

扎波罗热核电站附近发生“不同寻常”的大量枪击

新华社维也纳7月13日电(记者孟凡宇 于涛)国际原子能机构13日发表声明说,扎波罗热核电站附近12日晚发生“不同寻常”的大量枪击,这对核安全和安保可能造成威胁。国际原子能机构总干事格罗西在声明中说,驻扎在扎波罗热核电站的国际原子能机构工作团队报告说,当地时间12日晚10时开始,小型武器射击声持续约一
2025-07-14 03:00:00

华为盘古团队回应开源模型抄袭:严格遵循开源许可证的要求

新京报贝壳财经讯(记者韦博雅)近日,网络上有声音质疑华为盘古大模型涉嫌抄袭阿里巴巴通义千问模型。7月5日,华为盘古Pro MoE技术开发团队发表声明称,盘古Pro MoE开源模型是基于昇腾硬件平台开发、训练的基础大模型,并非基于其他厂商模型增量训练而来。开发团队称,盘古Pro MoE开源模型部分基础
2025-07-06 08:44:00

华硕B850/B860主板可颜可战 带你解码《多重人生》

你是否曾经想过这些问题:如果当初选择其他专业就读会怎样?如果当初进入其他行业会怎样……现在,科幻生存游戏《多重人生》可以创造出各种不同版本的你。游戏主角扬·道尔斯基因飞船失事迫降在一个充满辐射的星球,面对恶劣环境,一人的力量远远不够,因此必须借助尚可运转的量子计算机,计算出不同人生路径的“自己”,并
2025-07-05 00:04:00

网站内容来自网络,如有侵权请联系我们,立即删除!
站长邮箱 admin@99-bm.com Copyright © 99便民 鲁ICP备19046937号-5