虽然全球最顶级的AI晶片仍由Nvidia全面主宰,这次深度求索重击美股,加上最近Nvidia股价弱势,鼓舞开发商未来可能不需要砸大钱买高阶AI晶片就能做出适合自己用的AI模型,会激励AI ASIC晶片产业蓬勃发展。
美国总统川普刚就任的隔天,马上召集软银、甲骨文和OpenAI高层,将耗资五千万美元在美国成立类似主权AI的相关投资计画。不料,隔天原本没有名气的中国深度求索(DeepSeek)发表一款AI模型R1,之后引发华尔街市场大震撼,且被市场称为「AI珍珠港事件」,袭击美国AI相关股,并让美股在一月二十七日当天市值蒸发掉一兆美元,与AI关联度最高的费城半导体指数当天重挫后,因Nvidia表现不佳至今走势相对弱势,等于是给川普洗脸。
美国与中国关系恶化,从八年前川普在第一任总统期间宣布向中国发动贸易战。拜登继任总统后,除贸易战外还扩大封锁中国科技。对中国的科技封锁不限美国企业,还把美国所有的盟友拉进来,持续要求外资企业撤离中国并选边站。在这样敌我界线分明下,中国透过各种管道还是有能力拿到Nvidia的高阶AI晶片。深度求索承认使用约两千多片的H200晶片,且整个开发成本仅约五六○万美元就打造出能与OpenAI、谷歌同等级的AI模型DeepSeek-R1。
这样的AI模型成本结构与美国大型CSP业者至少要使用一.六万片的H200和H100晶片相比,其开发成本仅是OpenAI成本的二%。在DeepSeek-R1大出锋头后,引发全球用户大量下载,不到一个星期,累积的下载次数超过一六○○万次,尤其以印度用户的下载数量最高。
华尔街质疑开发成本过低
衝击过后,华尔街引述数名半导体分析师对深度求索能以如此低成本,打造出能与美国先进AI模型相匹敌产品提出质疑,大部分分析师普遍认为深度求索不太可能以这么低的成本打造出具突破性的AI模型,要不然那些美国大型CSP业者过去不就白花钱。OpenAI创办人阿特曼(Sam Altman)也跳出来质疑,深度求索有不合法使用OpenAI模型的技术,而他们也掌握相关的证据。部分晶片分析师认为,深度求索应该用到五万片的AI晶片才做得出来,而五六○万的开发成本也仅能算是应用上的使用成本。因为五万片AI晶片的成本就不只这些金额,也有分析师质疑应该有中国政府介入,才有办法做得出来。
Meta目前正在研发的Research SuperCluster(RSC)至少就使用超过一.六万片的A100晶片,该公司目前的Llama大型语言模型、谷歌Gemini和OpenAI的AI模型也都耗掉上万片的AI晶片才做得出来。特斯拉创办人马斯克的xAI早已购入超过十万片的H200和H100晶片,只要Nvidia的GB200晶片出得了货,也都会被特斯拉、甲骨文和大型CSP业者扫货。市场担心如果深度求索能以极低的成本打造出AI模型,就会引来AI产业反思是否真的有必要砸大钱打造AI模型,甚至引发AI产业是否将泡沫化的问题。
遭美国封锁下生出的产品
以时间推论,不论是深度求索在去年十二月下旬推出的DeepSeek-V3还是这次令市场震撼的DeepSeek-R1 AI模型,在开发期间都处于被美国政府科技封锁期间。虽然Nvidia推出阉割版的H20晶片,只有H200本尊效能的十分之一,他们还是能开发出顶尖的AI模型出来。先进的AI系统需归纳文字、图片、影音等大数据的深度学习技能,深度求索大概是把这些数据分析工作分配给多个不同模型,每个模型负责特定领域,力求让高效数据处理的时间缩短。这种方式在美国和其他发展AI模型的国家并非没做过,只不过是没办法像深度求索那样仅用到更少的运算能力就做到这样的地步。(全文未完)
全文及图表请见《先探投资周刊2338期精彩当期内文转载》
发表意见
中时新闻网对留言系统使用者发布的文字、图片或檔案保有片面修改或移除的权利。当使用者使用本网站留言服务时,表示已详细阅读并完全了解,且同意配合下述规定:
违反上述规定者,中时新闻网有权删除留言,或者直接封锁帐号!请使用者在发言前,务必先阅读留言板规则,谢谢配合。