您的位置: 首页 > 实时讯息 >

阿里发布最新开源推理模型,“性能比肩DeepSeek-R1”

0次浏览     发布时间:2025-03-07 00:20:00    

澎湃新闻记者 胡含嫣

阿里通义发布最新开源推理模型,称其性能比肩DeepSeek-R1。

3月6日凌晨,阿里巴巴正式发布最新的开源推理模型通义千问QwQ-32B。据介绍,通过大规模强化学习,千问QwQ-32B在数学、代码及通用能力上实现质的飞跃,整体性能比肩DeepSeek-R1,同时大幅降低了部署使用成本,在消费级显卡上也能实现本地部署。QwQ-32B采用了Apache 2.0开源协议,目前,所有人都可免费下载及商用QwQ-32B模型,或通过网页版Qwen Chat进行体验,该模型也将免费上架通义APP。

阿里通义团队表示,QwQ-32B模型拥有320亿参数,其性能可与具备6710亿参数(其中370亿被激活)的DeepSeek-R1媲美。在冷启动的基础上,模型针对数学和编程任务、通用能力分别进行了两轮大规模强化学习,在32B的模型尺寸上获得了令人惊喜的推理能力提升,印证了大规模强化学习可显著提高模型性能。

此外,QwQ-32B模型中还集成了与智能体(Agent)相关的能力,使其能够在使用工具的同时进行批判性思考,并根据环境反馈调整推理过程。

千问QwQ-32B既能提供极强的推理能力,又能满足更低的资源消耗需求,这背后的奥秘便在于强化学习(Reinforcement Learning)。阿里通义团队表示:“我们希望,我们的一点努力能够证明强大的基础模型叠加大规模强化学习也许是一条通往通用人工智能(AGI)的可行之路。”

在一系列权威基准测试中,千问QwQ-32B模型都表现出色,几乎完全超越了OpenAI去年9月发布的尺寸相近的o1-mini模型,比肩最强开源推理模型DeepSeek-R1:在测试数学能力的AIME24评测集上,以及评估代码能力的LiveCodeBench中,千问QwQ-32B表现与DeepSeek-R1相当,远胜于o1-mini及相同尺寸的R1蒸馏模型。

QwQ-32B模型和R1、OpenAI-o1-mini等知名模型的评分比较。来源:阿里通义

阿里通义团队表示,未来将继续探索将智能体与强化学习的集成,以实现长时推理,探索更高智能进而最终实现AGI的目标。

3月6日早盘,阿里巴巴集团(09988.HK)港股大幅高开涨超6%,截至午盘涨超7%。

此前,2月25日,阿里通义Qwen发布基于旗舰模型Qwen2.5-Max构建的推理模型QwQ-Max-Preview预览版,支持联网搜索,会和DeepSeek以及Kimi的推理模型一样展现思考过程,目前用户可在通义千问网页版进行体验。



本期编辑 邢潭


图片

相关文章

每只直径必须26厘米 揭秘8万只五彩气球如何飞上蓝天

在9月3日纪念活动的尾声,相信大家对和平鸽与五颜六色的气球同框的一幕印象深刻。8万只气球应声喷薄而出,在天空中汇聚成一片绚烂的彩色海洋。在这几十秒的视觉震撼背后,藏着8万只气球的“闯关之旅”,材质韧性、颜色饱和度到升空速度,每一项指标都经过团队严苛测试,层层筛选,最终才让这场“空中礼赞”完美呈现。8
2025-09-05 20:56:00

普通用户:2666MHz-3200MHz频率DDR4内存够用!

【ZOL中关村在线原创行业观点】"频率越高性能越好" 的说法流传甚广,但实际使用中的体验是否真的如此?普通用户是否需要追求高频率内存?新一代 DDR5 内存相比 DDR4 究竟有多少提升?今天我们来谈谈这些话题!内存作为 CPU 与存储设备之间的数据中转站,其性能直接影响系统响应速度。频率作为内存的
2025-09-04 06:57:00

国务院发文,支持种植、养殖等农业领域智能应用

国务院关于深入实施“人工智能+”行动的意见国发〔2025〕11号各省、自治区、直辖市人民政府,国务院各部委、各直属机构:为深入实施“人工智能+”行动,推动人工智能与经济社会各行业各领域广泛深度融合,重塑人类生产生活范式,促进生产力革命性跃迁和生产关系深层次变革,加快形成人机协同、跨界融合、共创分享的
2025-09-01 18:47:00

淘宝闪购饿了么官宣:这套请骑士们一起参与设计的职业制服,终于来了

潮新闻客户端 记者 陈婕 黄伟芬8月25日,淘宝闪购、饿了么正式发布全新升级的秋季骑士服。新制服采用赛车服风格设计,利落的倒三角版型与类连体式剪裁,塑造出干练的视觉效果。肩线挺括、腰线收束的设计,既满足骑士们的活动需求,又展现出鲜明的职业气质,凸显了城市骑士兼具活力与专业的职业形象。同时,淘宝闪购和
2025-08-25 11:12:00

AI Agent能力持续拓展,混合式AI龙头配置价值凸显

近日,华泰证券发布研报称生成式AI正迈入以AI智能体为主导的新发展阶段,智能体引发了“无就业增长”与“超级个体”并存现象。报告显示,全球AI产业链重构,从平行发展到竞合新常态,以联想集团为代表的中国科技七巨头从2025年1月开始,股价显著跑赢美国七姐妹。华泰证券认为一方面要关注Agent AI、物理
2025-08-22 00:04:00

更强的235B来了!白山云已上线升级版Qwen3模型

导语:450元大模型API体验金,速领~7月22日,阿里千问宣布推出 Qwen3-235B-A22B-FP8 非思考模式(Non-thinking)的更新版本,命名为 Qwen3-235B-A22B-Instruct-2507-FP8。白山云科技已在第一时间火速完成部署上线,用户可通过访问“白山智算
2025-07-24 00:04:00

网站内容来自网络,如有侵权请联系我们,立即删除!
站长邮箱 admin@99-bm.com Copyright © 99便民 鲁ICP备19046937号-5