您的位置: 首页 > 实时讯息 >

阿里发布最新开源推理模型,“性能比肩DeepSeek-R1”

0次浏览     发布时间:2025-03-07 00:20:00    

澎湃新闻记者 胡含嫣

阿里通义发布最新开源推理模型,称其性能比肩DeepSeek-R1。

3月6日凌晨,阿里巴巴正式发布最新的开源推理模型通义千问QwQ-32B。据介绍,通过大规模强化学习,千问QwQ-32B在数学、代码及通用能力上实现质的飞跃,整体性能比肩DeepSeek-R1,同时大幅降低了部署使用成本,在消费级显卡上也能实现本地部署。QwQ-32B采用了Apache 2.0开源协议,目前,所有人都可免费下载及商用QwQ-32B模型,或通过网页版Qwen Chat进行体验,该模型也将免费上架通义APP。

阿里通义团队表示,QwQ-32B模型拥有320亿参数,其性能可与具备6710亿参数(其中370亿被激活)的DeepSeek-R1媲美。在冷启动的基础上,模型针对数学和编程任务、通用能力分别进行了两轮大规模强化学习,在32B的模型尺寸上获得了令人惊喜的推理能力提升,印证了大规模强化学习可显著提高模型性能。

此外,QwQ-32B模型中还集成了与智能体(Agent)相关的能力,使其能够在使用工具的同时进行批判性思考,并根据环境反馈调整推理过程。

千问QwQ-32B既能提供极强的推理能力,又能满足更低的资源消耗需求,这背后的奥秘便在于强化学习(Reinforcement Learning)。阿里通义团队表示:“我们希望,我们的一点努力能够证明强大的基础模型叠加大规模强化学习也许是一条通往通用人工智能(AGI)的可行之路。”

在一系列权威基准测试中,千问QwQ-32B模型都表现出色,几乎完全超越了OpenAI去年9月发布的尺寸相近的o1-mini模型,比肩最强开源推理模型DeepSeek-R1:在测试数学能力的AIME24评测集上,以及评估代码能力的LiveCodeBench中,千问QwQ-32B表现与DeepSeek-R1相当,远胜于o1-mini及相同尺寸的R1蒸馏模型。

QwQ-32B模型和R1、OpenAI-o1-mini等知名模型的评分比较。来源:阿里通义

阿里通义团队表示,未来将继续探索将智能体与强化学习的集成,以实现长时推理,探索更高智能进而最终实现AGI的目标。

3月6日早盘,阿里巴巴集团(09988.HK)港股大幅高开涨超6%,截至午盘涨超7%。

此前,2月25日,阿里通义Qwen发布基于旗舰模型Qwen2.5-Max构建的推理模型QwQ-Max-Preview预览版,支持联网搜索,会和DeepSeek以及Kimi的推理模型一样展现思考过程,目前用户可在通义千问网页版进行体验。



本期编辑 邢潭


图片

相关文章

硅谷集体失眠!互联网女王340页AI趋势报告刷屏

当地时间5月30日,玛丽·米克尔(Mary Meeker)发布了长达340页的“AI趋势报告”。报告显示,AI的发展速度前所未见,用户增长、使用量和资本支出均呈现出爆炸式增长,其影响力可能远超技术本身。玛丽·米克尔是美国风险投资家,曾就职于摩根士丹利和凯鹏华盈(Kleiner Perkins),于2
2025-06-03 10:23:00

芝罘区建昌街小学“跳蚤市场”开市了!

大小新闻5月30日讯(YMG全媒体记者 岳媛祯 通讯员 毕翔)近日,芝罘区建昌街小学举办了一场别开生面的“跳蚤市场”义卖活动,全校师生踊跃参与,共度欢乐“六一”。活动开始前,学生们纷纷将提前准备好的义卖物品摆放整齐。这些物品包括个人闲置的学习用品、书籍、玩具,还有亲手制作的手工艺品等,真正做到了变废
2025-05-30 20:35:00

江西举办消费维权能力提升培训班

【来源:中国消费者报•中国消费网】中国消费者报南昌讯(记者朱海)5月20日至21日,江西省消费者权益保护委员会在南昌举办全省消费维权能力提升培训班。来自上海市市场监管局投诉举报中心、江西省高级人民法院等单位的相关负责人,就12315投诉举报数智化分析应用、商品房消费纠纷调处、预付式消费纠纷适用法律等
2025-05-22 06:47:00

总制作人王锐祥:融合科技、艺术与文化,屏幕前看十五运会开幕式效果同样非凡

5月20日,十五运会和残特奥会开幕式主创团队进驻大会在广东省奥林匹克体育中心体育场举行。这标志着十五运会开幕式主创团队正式进驻广东奥体中心,残特奥会开幕式主创团队正式进驻天河体育中心。十五运会开幕式总导演郎昆、艺术总监陈维亚、总监制刘伟强、总制作人王锐祥等人亮相大会,并接受了羊城晚报等媒体采访,向公
2025-05-20 20:00:00

中国移动互联网最值钱的那个按钮,是如何变“蓝”的?

作者丨雪豹财经社 吴姿中国移动互联网最值钱的按钮是什么?它必须是庞大用户基数、高点击率、高转化率且直接关联商业价值的核心交互入口。从这个维度衡量,说淘宝App的一级流量入口是中国移动互联网最值钱的那个按钮,大抵并不突兀。早在2013年,淘宝就曾高调推出外卖业务入口。但在随后相当一段时间内,这个入口
2025-05-16 17:16:00

刚刚,福布斯发榜!武汉第四!

5月11日2025 福布斯中国人工智能科技企业TOP 50评选及子评选结果发布武汉共有9家企业上榜位列全国第四仅次于上海、北京和深圳武汉人工智能研究院院长王金桥获评2025福布斯中国人工智能影响力人物过去五年,武汉人工智能产业复合增长率超40%,已聚集1000多家人工智能相关企业,核心产业规模超50
2025-05-11 18:20:00

网站内容来自网络,如有侵权请联系我们,立即删除!
站长邮箱 admin@99-bm.com Copyright © 99便民 鲁ICP备19046937号-5