中国DeepSeek的创新技术给生成式AI生态圈投下震撼弹,投资顾问公司The Motley Fool点名两家美国科技大厂可能是出乎意料之外的大赢家。
DeepSeek宣称以不可思议的560万美元超低成本打造出媲美ChatGPT的AI模型。相较之下,OpenAI为了训练GPT-4砸下1亿美元。
分析指出,DeepSeek令人惊艳之处在于让它有限的硬体达到效能的最大化。受限于美国的AI晶片出口禁令,辉达最强大的GPU晶片H100不得卖给中国,只能提供中国企业降规版的H800晶片。为了尽可能将该降规版晶片的效能放到最大,DeepSeek开发出能减少传输资料量的技术,例如该公司去年推出的「混合专家」模型DeepSeekMoE,只需启动模型的一部分即可回应用户查询。
换句话说,AI推理的取得将变得容易许多,未来随身放在口袋里的装置就可以运行AI系统,且成本低廉,而两家科技大厂可望成为最大的赢家:苹果和Meta Platforms。分析指出,DeepSeek的AI技术可望实现终端装置的AI(On-device AI),而将用户隐私视为首要之务的苹果可望受惠。
脸书母公司Meta Platforms则将受惠于把AI推广给30亿用户。Meta决定让自家的Llama成为开源式AI模型,而DeepSeek使用Llama作为开发R1模型的基础,这正是Meta希望看到的。降低AI推理的成本可望为Meta解锁庞大的获利,而DeepSeek提出了解方,为Meta将AI拓展到其30亿用户提供了利器。
不过,DeepSeek虽宣称其媲美OpenAI生成式聊天机器人ChatGPT的AI模型「V3」只花费557.6万美元且仅使用2048颗辉达H800晶片,但晶片研究机构Semianalysis日前出具报告指出,DeepSeek的硬体支出其实远超出5亿美元。
该分析报告指出DeepSeek使用5万颗辉达Hopper架构GPU,其中包括1万颗H800和1万颗H100,以及一些中国特供版H20。以此估算,DeepSeek的总资本支出约为16亿美元,其中对GPU的投资额达超出5亿美元。
发表意见
中时新闻网对留言系统使用者发布的文字、图片或檔案保有片面修改或移除的权利。当使用者使用本网站留言服务时,表示已详细阅读并完全了解,且同意配合下述规定:
违反上述规定者,中时新闻网有权删除留言,或者直接封锁帐号!请使用者在发言前,务必先阅读留言板规则,谢谢配合。