彭博社引述知情人士报导,由马云支持的蚂蚁集团(Ant Group Co)使用中国制的半导体来开发训练AI模型的技术,且成本降低20%。

蚂蚁集团表示,该公司使用高性能硬体训练1兆个token的成本约为635万元人民币(约88万美元),但其优化方法使用低规格硬体训练1兆个token的成本降至510万元人民币。

知情人士表示,蚂蚁使用其关系企业阿里巴巴集团控股公司和华为技术生产的「国产晶片」,来训练採用「混合专家」(Mixture of Experts,MOE)机器学习与深度学习架构的AI模型,所得到的结果与採用辉达H800等晶片相似。知情人士表示,蚂蚁仍在使用辉达晶片开发AI系统,但现在其最新的模型主要依赖其他公司的晶片,包括超微的晶片和中国制晶片。

这些AI模型意味着蚂蚁加入了美中两国企业的竞争。自从DeepSeek展示如何以远低于OpenAI和谷歌的成本训练出性能强大的AI模型以来,这场美中企业之间的竞争便愈演愈烈。这也凸显出中国企业多么想让中国制晶片来取代辉达最先进的半导体。

MoE模型的训练通常仰赖高效能晶片,如辉达的GPU。到目前为止,其成本对许多规模较小的公司而言实在高不可攀,也限制了该AI模型的普及。蚂蚁一直致力于如何更有效地训练LLM,并消除这样的限制。该公司的报告标题明确表示,其设定的目标是「不使用高阶 GPU来扩展模型」。

这与辉达打的如意算盘背道而驰。上周在GTC年度开发者大会上,辉达执行长黄仁勋表示,即使出现像DeepSeek R1如此低成本高效能的AI模型,但运算需求仍将大幅成长。他认为企业需要的是更好的晶片来创造更多的收入,而非使用较便宜的晶片来降低成本。

今年初,中国新创公司DeepSeek号称以极低成本、较少的AI晶片就打造出极具竞争力旳AI模型,这令投资人对估值已高的辉达及其昂贵的AI晶片信心动摇,使辉达股票一度遭到抛售。

#黄仁勋 #辉达 #马云 #人工智慧 #开源模型