您的位置: 首页 > 实时讯息 >

20万块英伟达芯片练出Grok 3:测试得分均高于竞争对手,运算能力是上代10倍

0次浏览     发布时间:2025-02-18 17:55:00    

预热许久的“地表最聪明AI”Grok 3正式亮相。

2月18日,特斯拉创始人埃隆·马斯克旗下xAI推出最新大模型Grok 3,并在直播中进行了现场演示。马斯克称,非常高兴能够推出 Grok3,它的能力将在短时间内比Grok2强大了十倍。“xAI和Grok的目的是理解宇宙的本质。”

功能完整的Grok 3将在一周后正式上线,不过用户依旧需要“钞能力”才能体验到最新版本的Grok。

直播介绍,Grok 3测试版现已面向马斯克旗下X平台的X Premium订阅用户开放,“我们今天将推出Grok3,首先从X上的Premium Plus订阅者开始,他们将是第一批获得访问权限的人。请确保更新您的X应用程序以探索所有高级功能,因为我们刚刚发布了更新。如果您有兴趣尽早使用Grok 3,请注册Premium Plus。”

xAI还针对Grok 3开发了新的订阅功能。“此外,我们还将为想要获得最先进功能和尽早使用新功能的忠实粉丝推出一项名为Super Grok的单独订阅。这项服务适用于Grok应用程序和新网站grok.com。”据报道,

马斯克表示,预计一周之后Grok 3的所有功能将正式上线。他说,“如果你想要一个更完善的版本,可能值得等待一周,但每天都会有所改进。我们还在开发语音交互功能,以便你可以拥有对话体验。我今天早些时候试过了,效果很好,尽管它仍然需要一些完善。我们的目标是让你可以像和人交谈一样和它交谈。我认为这将是Grok3最好的体验之一,但这应该还要一周左右的时间。”

马斯克说,计划在每次发布新版本时,对上一版本进行开源,也就是说,几个月后Grok 2即将开源。

xAI工程师介绍,虽然Grok起步较晚,但在MMLU(大规模多任务语言理解基准测试)得分上以超快地速度追上了ChatGPT,Grok 3和轻量化的Grok 3 mini在多方面性能上都超过或媲美Gemini、DeepSeek和GPT-4o等对手。

据介绍,Grok 3在数学推理、科学逻辑推理和代码写作等项目的Benchmark测试(基准测试)中均取得了比DeepSeek-v3、GPT-4o、Gemini-2 Pro更优的效果。Grok 3分别得分为52、75和57。Grok 3 mini分别得分为40、65和41。这两个模型的得分都高于Gemini、DeepSeek、Claude和GPT。

工程师说,“大约五天前,AIME2025竞赛结束了,高中生们在一个特定的基准上竞争。然后我们让两个模型在同一场考试中在同一基准上竞争。有趣的是,更大的Grok3推理模型在这场考试中表现更好。这表明,与较小的模型相比,较大的模型具有更强的泛化能力。然而,在去年的考试中,较小的模型表现更好,因为它更有效地学习了以前的考试。”

在加州大学伯克利分校推出的Chatbot Arena (LMSYS)盲测中,早期版本的Grok 3化名“巧克力”打榜,一举夺魁并成为唯一一个得分超1400的模型,其在代码、指令响应等各个方面排名均为第一。

据马斯克此前介绍,Grok 3是在大量的合成数据上训练的。它会反复检查数据,试图达到逻辑一致性。如果有错误的数据,它会反思并删除错误数据。

值得一提的是,有工程师还透露了xAI旗下超算中心算力已经翻倍,英伟达GPU数量已达到20万块。

据介绍,去年4月,马斯克认为xAI若想成功打造出最佳AI,唯一途径是自建数据中心。由于想尽快推出Grok 3,时间紧迫,于是决定在四个月内建成数据中心。最终,团队耗时122天让第一批10万个GPU启动并运行。

不过要构建理想中的AI需将集群规模翻倍。发布会上透露,这也是团队首次公开谈论此事,团队仅用92天就已经实现了超算集群的算力翻倍,也就是GPU数量已达20万块。如今,xAI正利用这些强大的计算能力持续改进产品。

团队还透露,xAI已经开始研究下一个集群,为了能够带动更为强大的AI,其功率将提高约五倍,达到大约1.2千兆瓦。

现场,马斯克和工程师们演示了Grok 3的多种能力。在演示中,Grok 3为太空发射生成动画3D,以及开发了一款将俄罗斯方块和宝石迷阵结合的游戏。

Grok 3为太空发射生成动画3D

Grok 3开发的游戏

此外,xAI的游戏工作室也正式得到官宣。马斯克表示,“我们将在xAI推出一个人工智能游戏工作室。如果你有兴趣加入我们并开发人工智能驱动的游戏,请加入我们。”

澎湃新闻记者 吴遇利

(本文来自澎湃新闻,更多原创资讯请下载“澎湃新闻”APP)

相关文章

招银理财招睿美元慧盈(标普500)封闭10号固收类6月3日起发行,业绩比较基准2.05%-7.35%

6月3日,据招银理财披露,该公司发行的招睿美元慧盈(标普500)封闭10号固收类理财计划认购期为2025年6月3日到2025年6月9日。认购起点为1美元,产品总发行规模下限500万美元,上限1000万美元。产品类型为固定收益类,风险收益评级PR2中低风险,预计存续期为183天,业绩比较基准为2.05
2025-06-03 17:12:00

硅谷集体失眠!互联网女王340页AI趋势报告刷屏

当地时间5月30日,玛丽·米克尔(Mary Meeker)发布了长达340页的“AI趋势报告”。报告显示,AI的发展速度前所未见,用户增长、使用量和资本支出均呈现出爆炸式增长,其影响力可能远超技术本身。玛丽·米克尔是美国风险投资家,曾就职于摩根士丹利和凯鹏华盈(Kleiner Perkins),于2
2025-06-03 10:23:00

G7宝宝看护器亮相中国联通数村大会,开启乡村科学育儿新实践

5月29日至30日,以“数字慧农,智慧兴村”为主题的中国联通2025年助力乡村振兴推进会在重庆召开。在留守儿童占比超40%的农村地区,中国联通带来了一款育儿黑科技产品——G7宝宝看护器(以下简称G7)。它不仅仅是一个摄像头,还具备安全防护、亲情互动、育儿辅助三大核心功能,用科技让育儿更安心、更科学,
2025-05-31 00:03:00

芝罘区建昌街小学“跳蚤市场”开市了!

大小新闻5月30日讯(YMG全媒体记者 岳媛祯 通讯员 毕翔)近日,芝罘区建昌街小学举办了一场别开生面的“跳蚤市场”义卖活动,全校师生踊跃参与,共度欢乐“六一”。活动开始前,学生们纷纷将提前准备好的义卖物品摆放整齐。这些物品包括个人闲置的学习用品、书籍、玩具,还有亲手制作的手工艺品等,真正做到了变废
2025-05-30 20:35:00

“KPI”出炉!基金经理拒绝“躺平”

赵梦桥 5月7日,证监会发布《推动公募基金高质量发展行动方案》(以下简称《方案》),全面建立以基金投资收益为核心的行业考核评价体系。出于对投资者长期利益的考量,《方案》中着重强调了公募基金产品多年以来“形同虚设”的业绩比较基准,并明确提出“强化业绩比较基准的约束作用”。该项措施无疑针对的是多年以来公
2025-05-26 14:35:00

新华图讯|孙颖莎夺得世乒赛女单冠军

5月25日,在卡塔尔多哈举行的2025世界乒乓球锦标赛女子单打决赛中,中国选手孙颖莎4比3战胜中国选手王曼昱,夺得冠军。 ↑孙颖莎在比赛中庆祝得分。新华社记者 王东震 摄 ↑孙颖莎在比赛中庆祝得分。新华社记者 肖艺九 摄↑孙颖莎在比赛中回球。新华社记者 刘续 摄
2025-05-25 19:45:00

网站内容来自网络,如有侵权请联系我们,立即删除!
站长邮箱 admin@99-bm.com Copyright © 99便民 鲁ICP备19046937号-5