您的位置: 首页 > 实时讯息 >

9.11比9.9大?马斯克声称“天下最聪明”的Grok3“翻车了”

0次浏览     发布时间:2025-02-19 14:08:00    

近日,马斯克与xAI团队,在直播中正式发布了最新版本Grok3。

此前,马斯克将Grok-3描述为“地球上最聪明的AI”。他在X平台上表示:“自己整个周末都在和团队打磨产品。”

然而据媒体报道,有人测试了最新的Beta版Grok3,并提出了那个经典的用来刁难大模型的问题:“9.11与9.9哪个大?”遗憾的是,在不加任何定语以及标注的情况下,号称目前最聪明的Grok3,仍然无法正确回答这个问题。

值得一提的是,用同样的问题询问DeepSeek时,无论是否开启深度思考(R1)模式,对方都给出了正确的答案:9.9大于9.11。

“9.11和9.9哪个大”是AI领域的一个经典问题。

艾伦研究机构(Allen Institute)成员林禹臣曾在社交媒体平台上发布的截图显示,ChatGPT-4o在回答中认为13.11比13.8更大。“一方面AI越来越擅长做数学奥赛题,但另一方面常识依旧很难。”他表示。

随后Scale AI的提示工程师莱利·古德赛德(Riley Goodside)基于此灵感变换了问法,拷问了可能是当时最强的大模型ChatGPT-4o、谷歌Gemini Advanced以及Claude 3.5 Sonnet——9.11和9.9哪个更大?这几家主流大模型通通答错,他也成功将此话题传播开来。

海外主流大模型答题。图源:第一财经

Grok-3发布会的背景板上,写着"our mission is to understand universe(我们的使命是了解宇宙)"。马斯克曾表示,xAI公司的目标就是“了解宇宙”。

在一周前,马斯克在直播中评论DeepSeek R1时,曾信心满满地表示“xAI即将推出更优秀的AI模型”。从现场展示的数据来看,Grok3在数学、科学与编程的基准测试上已经超越了目前所有的主流模型,马斯克甚至宣称Grok 3未来将用于SpaceX火星任务计算,并预测“三年内将实现诺贝尔奖级别突破”。

xAI在X平台直播,马斯克到场。图源:中国新闻周刊

马斯克强调,Grok-3可以减少AI幻觉,方法是通过来回检查数据并尝试实现逻辑一致性。他还透露,训练Grok-3所使用的算力远多于此前的版本,并使用了大量合成数据。

不同于DeepSeek的算法优化路径(DeepSeek-V3用2048个H800 GPU,训练2788千小时),xAI透露,Grok-3的开发的得益于用8个月时间建成的Colossus超级计算机,它由10万个英伟达的H100 GPU驱动,为训练提供了2亿个GPU小时,比Grok-2多十多倍。

此外,xAI宣布推出名为Deepsearch的Grok-3智能搜索引擎,名字和Deepseek颇有几分相似。

来源:九派新闻综合东方财经、第一财经、中国新闻周刊等

相关文章

Meta买下Scale AI半壁江山,谷歌据称准备斩断合作关系

财联社6月15日讯(编辑 赵昊)据媒体报道,知情人士透露,科技巨头谷歌计划终止与Scale AI的合作关系,因为后者刚刚宣布被谷歌的竞争对手Meta Platforms收购了49%的股份。其中一位消息人士称,谷歌原本计划今年向Scale AI支付约2亿美元,用于采购人工标注的训练数据,这些数据对开发
2025-06-15 02:05:00

“近视越晚戴眼镜越好”?关于近视,这些都是误区!

在儿童近视防控过程中,不少家长存在认知误区,而这些误区可能会影响孩子的视力健康。“防蓝光眼镜等于近视防护盾”,这种说法并不正确。防蓝光眼镜主要防范的是电子屏发出的部分蓝光波段,而与近视并无关联。目前没有证据表明蓝光会导致近视,过度用眼才是引发近视的罪魁祸首。因此,与其依赖防蓝光眼镜,不如控制孩子连续
2025-06-14 09:55:00

全国首个交通基建垂类大模型·灵筑智工亮相

工人日报-中工网记者 甘皙6月12日,成都首届垂类大模型产业大型活动——“大模型・全连接・新增长”城市论坛落幕。现场重磅发布得助大模型平台3.0、得助智能音视频服务平台3.0两大技术平台底座,推出银行、证券、汽车三大行业垂类大模型解决方案,并联合宁夏交建交通科技研究院正式发布全国首个交通基建垂类大模
2025-06-13 16:23:00

涨钱了!已开始执行!

为进一步健全内蒙古自治区社会救助标准动态调整机制,让困难群众共享经济社会发展成果。近日,内蒙古自治区人民政府印发了《关于2025年社会救助标准有关事宜的通知》,对全区社会救助标准进行了新一轮调整。那么,此次调整后社会救助标准有怎样的变化?一、2025年内蒙古社会救助标准调整的具体情况如何?内蒙古自治
2025-06-12 16:18:00

日本首店开业爆火!网友:呼市烧卖竟先我一步留洋了?

6月10日人民日报海外版刊发文章《从草原青城走向日本东京——一笼烧麦,香飘万里》介绍了老绥元烧卖在日本开店畅销的消息引发了网友的热议不少人转发文章并写到“作为呼和浩特人真是太骄傲了!”“烧卖替我去看世界,真好!”6月11日记者联系到了内蒙古老绥元餐饮管理有限公司进行采访了解烧卖出海热销背后的故事老绥
2025-06-12 12:02:00

看好公司前景和未来发展 一脉阳光核心高管自愿锁定股份

作为国内最大的第三方医学影像服务平台,一脉阳光(02522.HK)正通过"传统影响医疗+数据智能"的深度融合,打造医学影像全产业链服务平台,重塑行业未来格局。6月9日,公司发布公告,董事长及两位执行董事承诺至12月31日不减持。坚定看好公司前景和未来发展。聚焦三大增长极,夯实传统医疗智能化核心底盘通
2025-06-09 10:42:00

网站内容来自网络,如有侵权请联系我们,立即删除!
站长邮箱 admin@99-bm.com Copyright © 99便民 鲁ICP备19046937号-5