科技发展进入AI时代,但因AI产业链之技术密度,形成仅由数家高科技巨擘所把持的现况,包括从半导体设备、晶圆制造、AI加速器晶片、甚至生成式人工智慧模型,始终维持寡占局面,无形中也成为发展终端应用的壁垒。

直至DeepSeek以低成本优势引起市场讨论,虽持忧虑观点者认为这将打破过往云端服务供应商(CSP)巨额资本支出趋势为疑虑,但另一方面则认为其开源模型将刺激科技巨擘如ChatGPT等更加大方跟进开源,期待边缘AI应用进入大开大阖新局面。

DeepSeek并非今年农历春节期间发表,早在2023年上半年就开始进行募资与设立,其横空出世对科技产业影响,主要在二大观察:第一、AI模型效能与成本将由过去的直线,进入高斜率曲线。以往AI模型必须投入大量资源训练,也就是说希望增加1%的效能,就必须投入1%的资源,两者之间存在线型关系,所以AI加速器晶片始终稀缺,带动辉达、台积电享有高达七成、六成的毛利率,便是来自于争抢资源的军备竞赛。

但局势改变,并不代表科技巨擘会减少投资,反可能推动AI技术不断创新,将节省下来的资源投入更大规模的训练,以1%的资源,产出超过1%的效能,进而开发出更强的AI模型。

或许有人会提出不同看法,AI企业其实不用这样做。但实际上观察AI企业手中默默练功的顶尖模型,其实远超过市场上所见,AI企业多半先预留技术余量,等到竞争对手逼迫时才会陆续出手,这也是为何OpenAI 于2月初就能够立刻推出deep research模型的原因,因此,硬体军备投资升级成软体演算竞赛,预期未来AI模型的效能与成本曲线斜率应会更加陡升。

第二、就是採取开源模型对业界的刺激。AI模型开源不是由DeepSeek开先例,早在2024年初Meta发布了开源大型语言模型Llama 3,当时也引发业界对AI模型开源趋势的讨论。主要是因为开源模型可以降低了企业採用AI技术的门槛,企业可基于开源模型进行客制化开发,省掉大量不需要的资源与付出,大幅减少了技术研发成本。特别是对中小企业而言,开源模型多提供了一个经济且合理的AI应用方案选项。

此外,开源也将促进了AI生态圈创新和改进,特别是中国大陆地区的AI发展。开发者社群可共同优化模型性能,加速技术进步,这有助于建立更精准对应消费者所需要的AI生态系统。以DeepSeek开源为例,除了大型语言模型(LLM)、视觉语言模型(VLM),还有文生图模型(text to image)等近期都在中国大陆出现大爆发趋势,显示开源模型确实降低了入门槛。

开发者不需投入大量资源从零开始训练模型,可以专注于微调和应用开发,此种「站在巨人肩膀上」的方式,确实能大幅降低初期成本,有助于将AI应用由云端快速转为边缘落地,或许大家可以期待AI「华强北时代」即将来临。

科技始终来自于人性,科技进步目的也是为了服务人类,边缘AI相较云端AI更能贴近消费者,势必成为将来科技趋势之一。回顾以往中国大陆电子业的发展,IC设计扮演不可或缺的角色,除了因为深圳聚集硬体通路供应、系统整合人才以及大量生产能力的天时地利人和条件外,IC设计企业提供的Turnkey,更是降低开发资源的关键,得以快速发展出眾多应用,现阶段大陆AI企业启动开源模型,预期加速AI于边缘的实践商机,有望打破由上游寡占的态势,进入科技产业雨露均沾的新纪元。

#企业 #模型 #技术 #资源 #开发