外界对Grok 4寄予厚望,预计将与今年夏末推出的OpenAI新一代AI模型GPT-5一较高下。马斯克也预告Grok最迟下周就会应用在特斯拉电动车上。

马斯克9日在直播中表示:「在学术问题方面,Grok 4的表现已优于博士水准,毫无例外。虽然它有时缺乏常识,也尚未发明新技术或发现新物理学理论,但那只是迟早的问题。」

xAI本次一口气推出两款模型,分别是Grok 4和强化版的Grok 4 Heavy。xAI将Grok 4 Heavy称为「多代理人版本」,可同时产生多个AI代理人共同处理问题,然后彼此比较结果,像「读书会讨论」一样找出最佳答案。

xAI表示Grok 4在多项测试中表现优异,包含知名测验Humanity’s Last Exam。该测验针对数学、人文与自然科学领域,透过数千道群眾出题的问答来测试AI理解力。

在无任何工具辅助下,Grok 4在该测验中得分25.4%,超越Google Gemini 2.5 Pro的21.6%,及OpenAI高阶版模型o3的21%。在工具辅助的情况下,Grok 4 Heavy在该测验中得分44.4%,远胜过Gemini 2.5 Pro的26.9%。

xAI搭配新AI模型推出的SuperGrok Heavy订阅方案,能让订户抢先体验Grok 4 Heavy与其他新功能。该方案定位与OpenAI、Google、Anthropic提供的超高阶付费方案相似,但月费居目前市面AI平台之冠。

xAI表示SuperGrok Heavy订户在未来几个月能抢先使用即将推出的新产品,包括8月推出的AI程式编码模型、9月的多模态智慧代理,以及10月的影片生成模型。

#方案 #马斯克 #高阶 #模型 #辅助