0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

训练量暴增100倍!Grok 4推理碾压,马斯克预言两年内发现新物理定律

Monika观察 ? 来源:电子发烧友 ? 作者:莫婷婷 ? 2025-07-13 06:15 ? 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群




电子发烧友网报道(文/莫婷婷)7月10日,马斯克的AI公司xAI正式发布旗舰大模型Grok 4、Grok 4 API,同时推出AI订阅计划Super Grok Heavy,每月300美元(约合2153元人民币)。

马斯克对Grok 4的能力给予了高度评价,他表示,Grok 4的推理能力已超越人类水平,甚至比几乎所有学科的研究生具备更强的综合理解与分析能力。

在被称为“人类的最后考试”(Humanity's Last Exam)的综合性测试中,Grok 4取得了25.4%的准确率,且完全不依赖任何外部“工具”辅助。相比之下,谷歌Gemini 2.5 Pro的得分为21.6%,而OpenAI的o3(高版本)仅为21%。在这场全球顶尖模型的较量中,Grok 4一举超越了多位此前公认的领先选手,成为新一代大模型中的佼佼者。



除了Humanity's Last Exam的测试,Grok 4还在GPQA、AIME25、LCB(Jan-May)、HMMT25等测试中,超过了OpenAI o3、Gemini 2.5 Pro、Claude 4 Opus等大模型。

马斯克介绍,Grok 4未来将达到以下目标:它能在所有考试中答对所有题目;如果答错,它会指出问题出在哪里;如果题目存在歧义,它会将问题拆解为答案A、B和C,并消除歧义后的问题下,对选项A、B、C分别对应的解答。


马斯克表示,Grok 4每个学科都达到超博士水平,目前Grok 4还没有发明新技术或发现新物理定律的能力,但他认为在下半年、最迟也会在明年就能看到Grok 4发现具有实用价值的新技术,两年之内就会发现新物理定律。

Grok 4是如何实现如此高水平的推理能力。根据介绍,在训练层,每一代模型的训练规模都实现了数量级提升,Grok 4的训练量是Grok 2的100倍。马斯克明确表示,这个训练量还会持续增长。



训练算力有两种类型:一是Grok 2到Grok 3阶段的训练预算力,二是在Grok 3到Grok 4阶段,团队在强化学习的推理环节投入了大量算力。xAI团队通过训练Grok 2,首次实现了预训练规模的突破,团队发现如果真正精细地进行数据消融实验,以及基础设备、算法,就可以通过1.0倍的量大幅推进预训练,打造最佳的预训练基础模型。xAI将动用了有20万块H100 GPU的超级算力中心

与Grok 3不同,Grok 4将工具直接融入训练过程,使其成为模型的原生能力。在单智能体情况下,团队能解决40%的问题;随着测试与计算规模的扩大,团队已经能解决HRE问题中纯文本子集超过50%的内容。这是一个极其困难的任务,xAI表示。

在发布会上,xAI也正式推出了多智能体版本Grok 4 Heavy。在人类的最后考试测试中,Grok 4 Heavy取得44.4%的准确率。

马斯克指出Grok最大的弱点在图像理解、图像生成,xAI正在进行相关的训练。Grok 4基于第六代基础模型,第七代基础模型将在几周后完成,届时将改善图像领域的不足。

在开通AI订阅计划Super Grok后,用户就可以访问Grok 4,订阅费为每月30美金。如果成为Super Grok Heavy用户,就可以同时访问Grok 4和Grok 4 Heavy,订阅费为每月300美金。xAI表示,届时你将成为“一群Grok研究智能体的任务主管”,让你变得更聪明。

Grok 4以其超人类推理能力与跨学科统治力引发关注。此次发布不仅让Grok 4成为大模型性能天花板,也意味着xAI正以算力筑壁垒。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 大模型
    +关注

    关注

    2

    文章

    3210

    浏览量

    4165
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    DeepSeek最新论文:训练速度提升9推理速度快11

    电子发烧友网报道(文/梁浩斌)周二xAI发布了Grok3,这个马斯克称之为“地球上最聪明的AI”抢占了所有人的眼球。 ? 为了打造最强AI大模型,xAI投入了20万块H100 GPU,计算资源
    的头像 发表于 02-20 11:25 ?2148次阅读
    DeepSeek最新论文:<b class='flag-5'>训练</b>速度提升9<b class='flag-5'>倍</b>,<b class='flag-5'>推理</b>速度快11<b class='flag-5'>倍</b>!

    炸场!Grok 3击败Deepseek?马斯克20万显卡造AI

    电子发烧友网报道(文/莫婷婷)美国太平洋时间周一晚上8点(北京时间周二12点),马斯克旗下人工智能公司xAI正式发布新一代人工智能大模型Grok 3。在这款产品还未发布之前,马斯克就为它站台,表示
    的头像 发表于 02-19 09:03 ?2042次阅读
    炸场!<b class='flag-5'>Grok</b> 3击败Deepseek?<b class='flag-5'>马斯克</b>20万显卡造AI

    马斯克的“秘密武器”:Grok 3真的能轻松碾压DeepSeek和ChatGPT?

    作者:算力魔方创始人/英特尔创新大使刘力 2月17日,埃隆·马斯克旗下的xAI公司正式推出最新版聊天机器人Grok 3。马斯克称其为“地球上最聪明的人工智能”,这款备受瞩目的AI究竟有多厉害?它又
    的头像 发表于 02-19 16:41 ?3037次阅读
    <b class='flag-5'>马斯克</b>的“秘密武器”:<b class='flag-5'>Grok</b> 3真的能轻松<b class='flag-5'>碾压</b>DeepSeek和ChatGPT?

    马斯克发布Grok 3大模型,超越GPT-4o

    多项benchmark测试中,Grok 3取得了比DeepSeek-v3、GPT-4o以及Gemini-2 pro更优的效果。这一成绩无疑彰显了Grok 3在人工智能领域的卓越实力。 值得一提的是,
    的头像 发表于 02-19 13:50 ?475次阅读

    马斯克发布Grok-3,X平台用户可优先订阅

    近日,马斯克正式发布了备受期待的新一代人工智能模型Grok-3。据马斯克介绍,Grok-3及其迷你版Grok-3 mini在多方面的测试中均
    的头像 发表于 02-19 09:57 ?500次阅读

    马斯克揭秘Grok 3训练成本:20万块英伟达GPU

    近日,马斯克旗下的xAI公司正式推出了其新一代大模型——Grok 3。在备受瞩目的发布会直播中,马斯克亲自披露了Grok 3的训练成本,这一
    的头像 发表于 02-19 09:39 ?898次阅读

    马斯克即将发布Grok 3大模型,自诩“最聪明”AI

    近日,科技界迎来一则重大消息。特斯拉及SpaceX创始人马斯克在社交平台X上亲自宣布,其旗下人工智能公司倾力打造的大模型Grok 3将于北京时间18日中午12点震撼发布。马斯克对这款大模型充满信心
    的头像 发表于 02-18 15:02 ?687次阅读

    马斯克盛赞:xAI发布Grok 3推理模型,被誉为地球上最聪明的AI

    发布了 Grok 3 推理模型。 ? 马斯克在直播中说道:“我们非常高兴能够推出 Grok-3,它的功能比 Grok-2 强大一个数量级。能
    的头像 发表于 02-18 14:44 ?772次阅读
    <b class='flag-5'>马斯克</b>盛赞:xAI发布<b class='flag-5'>Grok</b> 3<b class='flag-5'>推理</b>模型,被誉为地球上最聪明的AI

    马斯克即将发布Grok 3大模型,誉为最聪明AI

    近日,科技巨头马斯克在社交平台X上宣布了一项重要消息。据他透露,其旗下的人工智能公司即将于北京时间18日中午12点正式发布大模型Grok 3。马斯克对这款新产品充满信心,甚至称其为“地球上最聪明的人
    的头像 发表于 02-17 14:27 ?811次阅读

    马斯克宣布Grok 3预训练完成,计算量大幅提升

    近日,特斯拉和SpaceX的创始人埃隆·马斯克在社交平台上发布了一条令人瞩目的消息。他宣布,公司研发的最新人工智能模型Grok 3已经完成了预训练阶段,并且其计算相较于上一代产品
    的头像 发表于 01-06 10:42 ?1221次阅读

    马斯克预言:AI将全面超越人类智力

    ,到2025年底之前,AI的智力水平将有望超越单个人类的智力。而到了2027年至2028年间,AI超越所有人类智力的可能性正在迅速增大。更令人震惊的是,马斯克认为,到2030年,人工智能超越所有人类智力的概率几乎达到了100%。 这一预测无疑引发了广泛
    的头像 发表于 12-28 14:23 ?801次阅读

    马斯克xAI计划:孟菲斯超算集群将扩大十

    个增加到至少100万个。这一举措将标志着Colossus超级计算机集群的十扩张,彰显出xAI在人工智能领域的雄心壮志。 据了解,Colossus超级计算机集群目前主要用于训练xAI的聊天机器人
    的头像 发表于 12-05 11:23 ?816次阅读

    特斯拉市值8500亿 马斯克坐稳世界首富的宝座

    美国总统选举结果出炉,随着而来是美国资本市场迎来了“特朗普交易”的情绪释放。大手笔押注特朗普的马斯克似乎已经成为特斯拉的大利好。 据外媒报道,马斯克这个大金主一共花费了1.3亿美元来支持特朗普竞选
    的头像 发表于 11-07 16:55 ?1063次阅读

    马斯克旗下xAI对Grok-2-mini进行速度升级

    科技巨头马斯克旗下的xAI公司近日宣布了一项重大进展,其热门语言模型Grok-2-mini成功完成了速度升级。
    的头像 发表于 08-27 15:28 ?655次阅读

    马斯克旗下AI初创公司发布Grok-2聊天机器人

    埃隆·马斯克麾下的创新AI企业xAI今日震撼发布了其最新力作——Grok-2聊天机器人,该产品在性能上自信地宣称已能与业界巨头OpenAI、谷歌及Anthropic的顶尖产品并驾齐驱。
    的头像 发表于 08-15 16:05 ?1212次阅读