Grok 4正式发布性能媲美GPT-5

外界对Grok 4寄予厚望，预计将与今年夏末推出的OpenAI新一代AI模型GPT-5一较高下。马斯克也预告Grok最迟下周就会应用在特斯拉电动车上。

马斯克9日在直播中表示：「在学术问题方面，Grok 4的表现已优于博士水准，毫无例外。虽然它有时缺乏常识，也尚未发明新技术或发现新物理学理论，但那只是迟早的问题。」

xAI本次一口气推出两款模型，分别是Grok 4和强化版的Grok 4 Heavy。xAI将Grok 4 Heavy称为「多代理人版本」，可同时产生多个AI代理人共同处理问题，然后彼此比较结果，像「读书会讨论」一样找出最佳答案。

xAI表示Grok 4在多项测试中表现优异，包含知名测验Humanity’s Last Exam。该测验针对数学、人文与自然科学领域，透过数千道群眾出题的问答来测试AI理解力。

在无任何工具辅助下，Grok 4在该测验中得分25.4％，超越Google Gemini 2.5 Pro的21.6％，及OpenAI高阶版模型o3的21％。在工具辅助的情况下，Grok 4 Heavy在该测验中得分44.4％，远胜过Gemini 2.5 Pro的26.9％。

xAI搭配新AI模型推出的SuperGrok Heavy订阅方案，能让订户抢先体验Grok 4 Heavy与其他新功能。该方案定位与OpenAI、Google、Anthropic提供的超高阶付费方案相似，但月费居目前市面AI平台之冠。

xAI表示SuperGrok Heavy订户在未来几个月能抢先使用即将推出的新产品，包括8月推出的AI程式编码模型、9月的多模态智慧代理，以及10月的影片生成模型。

#方案 #马斯克 #高阶 #模型 #辅助

留言规则

中时新闻网对留言系统使用者发布的文字、图片或檔案保有片面修改或移除的权利。当使用者使用本网站留言服务时，表示已详细阅读并完全了解，且同意配合下述规定：

请勿重覆刊登一样的文章，或大意内容相同、类似的文章
请不要刊登与主题无相关之内容
发言涉及攻击、侮辱、影射或其他有违社会善良风俗、社会正义、国家安全、政府法令之内容，本网站将会直接移除
请勿以发文、回文等方式，进行商业广告、骚扰网友等行为，或是为特定网站、blog宣传，一经发现，将会限制您的发言权限或者封锁帐号
为避免留言系统变成发泄区和口水版，请勿转贴新闻性文章、报导或相关连结
请勿提供软体注册码等违反智慧财产权之资讯
禁止发表涉及他人隐私、含有个人对公眾人物之私评，且未经证实、未注明消息来源的网路八卦、不实谣言等
请确认发表或回覆的内容（图片）未侵害到他人的着作权、商标、专利等权利；若因发表或回覆内容而产生的版权法律责任将由使用者自行承担，不代表中时新闻网的立场，请遵守相关法律规范

违反上述规定者，中时新闻网有权删除留言，或者直接封锁帐号！请使用者在发言前，务必先阅读留言板规则，谢谢配合。