DeepSeek-V3.1与前一代模型性能比较
DeepSeek-V3.1与前一代模型性能比较

DeepSeek时隔近五个月释出旗舰AI模型最新升级版V3.1,并暗示中国大陆将有自主研发的下一代AI晶片来支持该模型,引发市场高度关注。该消息22日刺激中国晶片概念股狂飙,其中,中芯科技A股一度涨逾15%。

DeepSeek于21日发表V3.1,据该公司介绍,该版本有多项重要升级,包括採用混合推理架构,支持思考与非思考模式的自由切换,回应效率有显着提升,智慧体(Agent)能力也进一步增强。

DeepSeek还介绍,V3.1使用UE8M0 FP8的参数精度,与V3版本存在明显差异。DeepSeek还在官方微博置顶留言中说,「『UE8M0 FP8』参数精度是针对即将发表的下一代国产晶片设计。」

CNBC提到,FP8是一种资料处理格式,可以提高大模型的训练和推理计算效率。DeepSeek去年12月发表的V3模型,据称是在约2,000块辉达「不太先进」的晶片上进行训练。

报导分析,DeepSeek提到中国即将推出下一代AI晶片,意味着在美国加强先进半导体出口限制,和中国推动晶片自给自足背景下,DeepSeek计划与中国新兴AI晶片生态系统进行更紧密的合作。

消息刺激大陆晶片概念股22日飙涨,其中,中芯国际A股盘中一度涨逾15%,收盘仍涨14.19%。海光信息、寒武纪科技均大涨20%。此外,在香港上市的大陆半导体类股跟涨,华虹半导体当天大涨17.85%、中芯国际H股亦收涨逾1成。

值得注意的是,寒武纪股价突破人民币(下同)1,200元关口,22日收报1,243.2元,创歷史新高,总市值突破5,000亿元大关,报5,201亿元,逼近中芯国际陆、港两市市值总和的5,203亿元。

中信建投证券指出,DeepSeek-V3.1版,新增支持FP8精度和中国国产晶片,此举有望推动国产算力生态加速完备。腾讯稍早在业绩会上透露,公司推理晶片供应管道多元化,国际供应链波动下,国产推理算力晶片或成助力。

该机构还表示,华为升腾晶片近期在政府、金融等行业的应用逐步扩大,进一步体现国产晶片的市场竞争力正在提升。

#下一代 #中国 #中芯国际 #模型 #中芯