您的位置: 首页 > 实时讯息 >

9.11比9.9大?马斯克声称“天下最聪明”的Grok3“翻车了”

0次浏览     发布时间:2025-02-19 14:08:00    

近日,马斯克与xAI团队,在直播中正式发布了最新版本Grok3。

此前,马斯克将Grok-3描述为“地球上最聪明的AI”。他在X平台上表示:“自己整个周末都在和团队打磨产品。”

然而据媒体报道,有人测试了最新的Beta版Grok3,并提出了那个经典的用来刁难大模型的问题:“9.11与9.9哪个大?”遗憾的是,在不加任何定语以及标注的情况下,号称目前最聪明的Grok3,仍然无法正确回答这个问题。

值得一提的是,用同样的问题询问DeepSeek时,无论是否开启深度思考(R1)模式,对方都给出了正确的答案:9.9大于9.11。

“9.11和9.9哪个大”是AI领域的一个经典问题。

艾伦研究机构(Allen Institute)成员林禹臣曾在社交媒体平台上发布的截图显示,ChatGPT-4o在回答中认为13.11比13.8更大。“一方面AI越来越擅长做数学奥赛题,但另一方面常识依旧很难。”他表示。

随后Scale AI的提示工程师莱利·古德赛德(Riley Goodside)基于此灵感变换了问法,拷问了可能是当时最强的大模型ChatGPT-4o、谷歌Gemini Advanced以及Claude 3.5 Sonnet——9.11和9.9哪个更大?这几家主流大模型通通答错,他也成功将此话题传播开来。

海外主流大模型答题。图源:第一财经

Grok-3发布会的背景板上,写着"our mission is to understand universe(我们的使命是了解宇宙)"。马斯克曾表示,xAI公司的目标就是“了解宇宙”。

在一周前,马斯克在直播中评论DeepSeek R1时,曾信心满满地表示“xAI即将推出更优秀的AI模型”。从现场展示的数据来看,Grok3在数学、科学与编程的基准测试上已经超越了目前所有的主流模型,马斯克甚至宣称Grok 3未来将用于SpaceX火星任务计算,并预测“三年内将实现诺贝尔奖级别突破”。

xAI在X平台直播,马斯克到场。图源:中国新闻周刊

马斯克强调,Grok-3可以减少AI幻觉,方法是通过来回检查数据并尝试实现逻辑一致性。他还透露,训练Grok-3所使用的算力远多于此前的版本,并使用了大量合成数据。

不同于DeepSeek的算法优化路径(DeepSeek-V3用2048个H800 GPU,训练2788千小时),xAI透露,Grok-3的开发的得益于用8个月时间建成的Colossus超级计算机,它由10万个英伟达的H100 GPU驱动,为训练提供了2亿个GPU小时,比Grok-2多十多倍。

此外,xAI宣布推出名为Deepsearch的Grok-3智能搜索引擎,名字和Deepseek颇有几分相似。

来源:九派新闻综合东方财经、第一财经、中国新闻周刊等

相关文章

数字中国发展情况如何监测评估?相关指标体系和发展指数公布

“2023年、2024年,数字中国发展指数分别为136.03、150.51,同比增长达10.10%、10.65%。”4月29日,在第八届数字中国建设峰会期间,国家数据发展研究院院长胡坚波发布了“数字中国发展指标体系”和数字中国发展指数测算情况。据胡坚波介绍,自2024年10月以来,该院会同国内多家高
2025-04-30 11:19:00

起步早、生态好、政策足!模速空间“C位出道”的阶跃星辰点赞“模都”

4月29日上午,习近平总书记在上海考察时,来到位于徐汇区的上海“模速空间”大模型创新生态社区调研。记者获悉,在“模速空间”展馆中,上海大模型独角兽企业阶跃星辰演示了旗下基础大模型的技术发展和应用情况。“国家高度重视人工智能的发展,其中基础大模型起到重要作用,是一场需要定力和实力的‘科技长征’。”阶跃
2025-04-29 23:26:00

景亚萍,被撤销全国政协委员资格

据新华社消息,政协第十四届全国委员会第三十五次主席会议29日在京召开。会议撤销景亚萍政协第十四届全国委员会委员资格的决定,提请全国政协十四届常委会第十二次会议追认。景亚萍(资料图)公开简历显示,景亚萍,女,汉族,1964年8月生,研究生,管理学博士,教授,中共党员、致公党党员。她是第十四届全国政协委
2025-04-29 18:04:00

“小学教材逼疯家长”,是时候给家长减负了!

家长不是“作业质检员”,用旧的知识储备强行辅导,既违背教育规律,也模糊了家校共育的边界。“万的第二笔不是撇吗?”“司马光砸的是瓮不是缸?”“嗯的拼音竟然不是en而是ng?”“数学题20-x=9,原本两步就能得出答案,现在需要五、六步?”△ 社交平台上,部分教材修改内容引发网友讨论最近,一篇《逼疯家长
2025-04-28 19:44:00

人才日,贵阳简历又上新!

4月25日是贵州省第五个“人才日”,4月26日至27日,第十三届贵州人才博览会隆重举行,在这个人才汇聚的时节,我敞开怀抱,向广大人才发出诚挚邀请——欢迎大家到我这里投资兴业、创新创业!不过在此之前,请允许我隆重的介绍一下我自己。“我叫贵阳”回顾近年我经历了无数高光时刻荣获“中国投资热点城市”“全国双
2025-04-26 20:20:00

一克商评|从“经验驱动”到“数据驱动”,四川场道以科技为翼实现“智能建造”

封面新闻记者 张越熙 易弋力科技创新+管理优化,四川场道打造精品工程4月25日,记者从四川省场道工程有限公司获悉,在数字化浪潮奔涌的当下,广安市政工程以科技为翼,通过无人机、智能安全帽、高边坡智能检测、物料验收系统、安全视频监控,实现数字底盘与实体工程的同步映射。面对山地仿古建筑复杂结构,团队创新应
2025-04-25 20:10:00

网站内容来自网络,如有侵权请联系我们,立即删除!
站长邮箱 admin@99-bm.com Copyright © 99便民 鲁ICP备19046937号-5