DeepSeek以远低大型AI模型公司硬体的成本,发展出类似效能的模型,引起市场对高算力需高投资说法的疑虑。AI晶片龙头辉达股价重挫近17%,市值蒸发5888亿美元,辉达发出声明,指出DeepSeek的运算符合美国出口限制,且推论仍需要大量辉达的GPU。
大陆AI模型公司DeepSeek最新的AI模型训练成本仅560万美元,反观AI模型龙头OpenAI的GPT模型训练成本却超过1亿美元,虽然DeepSeek的模型是由既有模型重新训练而成,但也让市场认为AI模型是否不需要设置太多的硬体,以降低资本支出。
辉达随即发表声明,表示DeepSeek展现出的成果,显示出如何用广泛可利用的模型,去建立新的模型,其运算也完全符合美国的出口管制,但仍强调,模型的推论仍需要大量辉达的GPU以及高效能的网路。
DeepSeek的论文指出,最新模型DeepSeek-R1仅使用约2000张辉达的H800的GPU,该晶片算力符合美国在2022年的出口管制措施,因此市场传出即使限制晶片算力,仍挡不住大陆AI在软体的发展。
发表意见
中时新闻网对留言系统使用者发布的文字、图片或檔案保有片面修改或移除的权利。当使用者使用本网站留言服务时,表示已详细阅读并完全了解,且同意配合下述规定:
违反上述规定者,中时新闻网有权删除留言,或者直接封锁帐号!请使用者在发言前,务必先阅读留言板规则,谢谢配合。