中方人工智慧(AI)新平台「深寻」(DeepSeek)一上架,就成为AI界的热门话题,也造成美国股市大地震,它不仅看起来能媲美OpenAI、Meta、Anthropic等顶尖企业的产品,而且只花费了560万美元(约1.8亿台币)成本差异极大,周二(28日)OpenAI执行长阿特曼(Sam Altman)发文肯定DeepSeek-R1模型和它的成本效益,但他也强调算力依然很重要。

DeepSeek-R1在数学、程式设计与复杂问题解决等任务中的推理表现,已与OpenAI的o1等领先模型匹敌,甚至在部分指标上超越,模型的开发仅耗时两个月,而且使用的是辉达(Nvidia)相对较旧的H800 GPU晶片进行训练,显得格外高效。

对于中国AI公司DeepSeek推出的高性价比R1模型,阿特曼于社群媒体X上贴文表示:「DeepSeek-R1确实令人印象深刻,尤其是在成本控制方面。」同时,他们强调将推出更强大的模型,维持技术领先,并欢迎新竞争者的加入:「新的竞争对手让人振奋!我们将带来更多更新与发表。」

OpenAI重申,团队的重点是执行既定研究计划,并认为计算能力至关重要:「加强计算能力比以往更关键,这是实现使命的基础。」

对于未来,OpenAI乐观表示,世界将广泛应用AI技术,并对下一代模型感到惊艷。他们承诺,将持续致力于通用人工智慧(AGI)的开发,并突破现有技术极限:「期待为大家带来AGI及更多成果。」

文章来源:deepseek's r1 is an impressive model, particularly around what they're able to deliver for the price.
#DeepSeek #OpenAI #DeepSeek-R1 #模型 #阿特曼