您的位置: 首页 > 实时讯息 >

阿里通义实验室黄斐:开源进入千问时代,即将发布的推理模型会更好用

0次浏览     发布时间:2025-02-21 22:44:00    

阿里通义千问已成全球第一大开源模型系列,将“很快”放出基于最新模型Qwen2.5-Max的推理模型。

2月21日,全球开发者大会(GDC)在上海开幕,在阿里云魔搭社区主办的论坛上,据阿里巴巴通义实验室科学家黄斐介绍,到目前为止,整个通义千问(Qwen)系列模型的下载量达到了1.8亿,累计衍生模型总数达到9万个,衍生模型数已经超越Meta的Llama系列,成为了全球第一大开源模型系列,并在Hugging Face等第三方榜单和用户反馈上也取得了不错的成绩:“所以现在开始,我们就是一个千问的时代,而不是之前Llama的时代了。”

今年1月底,阿里发布了AI基础大模型千问旗舰版Qwen2.5-Max,在多项权威基准评测中处于业界领先水平。黄斐表示,Qwen2.5-Max的性能已经超越了DeepSeek-V3,不过没有超越作为推理模型的DeepSeek-R1,正如阿里巴巴集团CEO吴泳铭此前所透露的那样,通义千问正在Qwen2.5-Max的基础上建立推理模型,“很快就会把这个模型放出来”。

据黄斐介绍,Qwen2.5已经开放了7个不同规模的Dense(稠密)模型,基于传统的Transformer架构,从规模最小的0.5B到最大的72B,不同大小的模型会有不同的能力和速度,以适配不同场景的需求。同时,在千问系列的迭代中,预训练数据的大小已经从Qwen1.5-72B时的3T迅速增长到了Qwen2.5-72B的18T,通过规模化法则(Scaling Law)达到了很好的效果。

此外,Qwen2.5还包括3个采用MoE(混合专家模型)架构的API(应用程序编程接口)模型,在Dense模型的基础上“加宽加大”以减少训练代价,用户可以通过API去调用,包括Turbo、Plus和Max这三个版本。

除了为用户提供充分的选择以外,黄斐还揭露了另一个让千问系列如此受欢迎的“秘诀”,即其支持包括中英文、日语、韩语、西欧各国语言在内的超过29种语言:“千问现在在东南亚国家也用得非常多,在多语言支持上会比其他模型好很多。”

对于未来的发展方向,黄斐谈到推理模型、“Smarter Models(更智慧的模型)”和全能模型(Omni Models)。黄斐解释道,接下来放出的千问推理模型“会比大家现在能用到的更好一些”,而“更智慧的模型”不仅会更聪明,还包括了更快的响应和更低的成本。全能模型则是指能将多模态混合的模型,在输入输出方面更加自由。

黄斐认为,在模型之外,AI Agent(智能体)也是一个需要重点关注的领域:“未来的一段时间内,AI Agent一定也是一个比较火热的话题。它能够帮助我们解决比较复杂的任务,尤其是结合近期推理模型的发展,我相信最终很多行业都可以运用到这个模型的能力,去完成现在只能由人完成的任务。”

据魔搭社区技术负责人陈颖达在该论坛上的介绍,自2022年11月创建以来,目前,魔搭社区的模型总量已超过4.5万个,涵盖LLM、对话、语音、文生图、图生视频、AI作曲等多个领域,魔搭社区已经服务超过1100万开发者。

在21日的GDC大会上,阿里云魔搭社区首发阶跃星辰最新开源的两款多模态模型,包括全球参数量最大的开源视频生成模型Step-Video-T2V,以及业界首款产品级开源语音交互模型Step-Audio。其中,Step-Video-T2V是基于300亿参数的文本转视频预训练模型,能够生成高达 204 帧的视频;Step-Audio则是业界首个产品级开源语音模型,参数规模达1300多亿。目前,这两款模型均可在魔搭社区下载和体验。

2月20日晚间,阿里巴巴集团公布新季度业绩,该季度营收2801.5亿元,预估2773.7亿元,同比增长8%。阿里云季度营收317.42亿元,同比增长13%,公共云收入持续两位数增长,AI相关收入连续六个季度三位数增长,调整后EBITA增长33%至31.38亿元。

阿里巴巴集团CEO吴泳铭在财报会上表示,面向未来,阿里巴巴将继续专注三大业务类型:国内外电商业务、AI+云计算的科技业务、互联网平台产品。未来三年,阿里将围绕AI这个战略核心,在AI基础设施、基础模型平台及AI原生应用、现有业务的AI转型等三方面加大投入。其中,集团未来三年在云和AI的基础设施投入预计将超越过去十年的总和。

澎湃新闻记者 胡含嫣

相关文章

起步早、生态好、政策足!模速空间“C位出道”的阶跃星辰点赞“模都”

4月29日上午,习近平总书记在上海考察时,来到位于徐汇区的上海“模速空间”大模型创新生态社区调研。记者获悉,在“模速空间”展馆中,上海大模型独角兽企业阶跃星辰演示了旗下基础大模型的技术发展和应用情况。“国家高度重视人工智能的发展,其中基础大模型起到重要作用,是一场需要定力和实力的‘科技长征’。”阶跃
2025-04-29 23:26:00

成都银行2024年报:资产、存贷规模连续四年千亿级增长

红星新闻网(记者 覃霞 实习生 夏一铭)4月29日报道4月28日晚,成都银行发布的2024年报。截至2024年末,该行资产总额、吸收存款、发放贷款分别站上12500亿元、8800亿元、7400亿元新台阶,连续四年实现千亿级增长,成长性保持行业领先;营业收入、净利润分别突破220亿元、120亿元新关口
2025-04-29 17:18:00

强回报 重创新 增信心 已有452家深市公司积极践行“质量回报双提升”

自2024年2月启动,深交所“质量回报双提升”专项行动已实施超过一年。据统计,已有452家深市公司发布“质量回报双提升”行动方案,围绕增强聚焦主业意识、提高创新发展能力、提升投资者回报水平等方面提出务实举措,推动“质量回报双提升”文化及理念塑造成为深市公司的共识。实证分析显示,“质量回报双提升”专项
2025-04-29 12:35:00

全球科研城市百强中位居31位,济南高新技术产业产值占比规上工业产值近六成

4月29日,济南市政府新闻办举行新闻发布会,围绕“加快建设科技强市 提升区域创新能力”介绍有关情况。新黄河记者从发布会上了解到,济南区域创新能力不断提升,创新平台体系更加完善。据悉,济南在全球科研城市百强名单中实现再进位,多项关键指标稳居全省首位,为省会高质量发展注入强劲动能。济南市科技局党组书记、
2025-04-29 11:34:00

发布亮眼一季度报后,东阿阿胶股价跌停:现金流隐忧引发争议|大鱼财经

4月27日,东阿阿胶(SZ000423)发布了2025年第一季度财务报告。报告显示,该公司营收与利润均实现了稳健的双位数增长,数据表面亮眼。资本市场却给出了截然相反的反应——东阿阿胶股价在次日交易中触及跌停,引发了投资者之间的激烈讨论。一季度业绩亮丽与股价罕见跌停根据财报,东阿阿胶在2025年第一季
2025-04-29 08:14:00

这场沉浸式安全课,大人小孩都玩嗨了!

红网时刻新闻4月28日讯(记者 胡芳 通讯员 张懿)4月28日下午,长沙市雨花区东塘街道枫树山社区的篮球场变身“安全教育大本营”,一场别开生面的安全嘉年华正在上演。居民们扶老携幼穿梭在各个体验区,有人戴着VR眼镜摇摇晃晃体验“酒驾”,小朋友钻进逃生帐篷学习火场自救,大爷大妈们围在反诈展台研究新型骗术
2025-04-28 22:11:00

网站内容来自网络,如有侵权请联系我们,立即删除!
站长邮箱 admin@99-bm.com Copyright © 99便民 鲁ICP备19046937号-5