DeepSeek的出现,对股市及AI发展带来相当大的衝击。DeepSeek宣称训练模型成本仅500万美元,远低于其他美国大厂的训练成本,且效能还相当;DeepSeek的app下载衝到第一后,华尔街立即感受其影响力。按各方报导,虽对其宣称的训练成本有所保留,但都肯定其促使快速降低AI成本的创新作法。

据媒体报导,台湾114年所编列的科技预算为新台币1,466亿元,概略可为44.5亿美元;当然,在立法院删减后,不清楚所剩可用的科技预算额度。原国内专家评估训练大型语言模型动辄需投入上亿美元,且台湾没有足够算力,倡议台湾不须自己训练大型语言模型。DeepSeek出现后,恐必须重新评估。

DeepSeek的成功,除源于它站在过去美国各巨人的肩膀,以开源模型为基础,同时发明许多创新作法,例如:混合专家模型(MoE)等,大幅提升训练效率、精准度,降低能源使用。

大约十年前,OECD一份研析未来生产力报告中,归纳出全球前沿技术与技术创新扩散两阶段生产力提升模式。此次全球AI的发展现象,与OECD报告所述相近:美国国际大厂致力探索开发全球最先进的AI大型语言模型,投入大量资金与人力且还有失败风险;来自中国大陆的DeepSeek,以开源模型为起点,重降低成本协助创新扩散应用。降低成本技术创新扩散,OECD认为关键在产学合作,企业藉着商业化的庞大利益,驱动大学研究与技术创新变现;只是,此次DeepSeek所仰赖的是开源模型,不是大学。

过去几年,中国大陆出口外贸新三样:电动车、锂电池及太阳能电池,及许多传统产业产品的大量出口,均引进全球前沿技术、将技术普及,再由政府引导大力投资,带动出口竞争力,给许多台湾及全球产品带来相当大的竞争压力。

根据去年诺贝尔经济学奖得主Daron Acemoglu分析,AI的发展与应用,会让厉害的研究人员更厉害,对平庸的研究人员帮助不大,这样的分析似乎也可合理类推到产业发展。那么,DeepSeek如果被整合应用到大陆其他已经领先于台湾传统产业垂直供应链营运上,所带动的竞争力提升,会如何影响台湾的传统产业?

「均衡台湾」是近两任总统的政策目标,期藉着推动六大区域产业及生活圈来达成:去年3月推出「桃竹苗大硅谷推动方案」,今年1月推出「大南方新硅谷推动方案」,两个方案都提及AI。前者偏重在新兴产业及科技新创的发展,后者则在投资算力及「AI产业化、产业AI化」包括餐饮、健康照护、零售、生活应用、资通讯、金属加工、车用零组件等。只是,网页上两个方案具体作法与内容均无明确说明,也未提及将投入任何产业的AI模型训练。

如将Daron Acemoglu的分析应用到产业层次,台湾歷来是晶片设计、各产业的制造流程等方面具出口竞争力的资优生,若能透过业者参与的资料累积与搜集,各自或共同发展出各个垂直产业链的AI基础模型,然后提供个别业者更有效率及有效地设计晶片、设计与产制各项产品,相信对台湾各个产业链出口竞争力有莫大的帮助。

TAIDE是台湾以开源模型所建立的人工智慧语言模型;当初建立模型时,面临最大的瓶颈除算力与经费,还在于可用数据资料匯集与取得不足。现今,DeepSeek已发明较低成本的模式,应有机会借镜并扩散到国内各产业。当然,除政府需建立公正第三方的可信流程与法制,引导业界参与提供资料,更须设计机制,吸引专家及公私资源共同参与。

DeepSeek让美国川普总统改口及国际大厂调整策略方向。对「均衡台湾」目标,赖总统也应有所作为:具体引导资源,挹注AI到国际竞争潜力的产业供应链,以维繫更多产业均衡发展,不再让台湾只是半导体与ICT组装;同时也提醒立院,面对中国大陆的产业政策,台湾需要足够科技预算因应。

#扩散 #训练 #美国 #模型 #应用