全球人工智慧行动峰会(AI Action Summit)连日在法国举行,中国GenAI业者DeepSeek的开发模型在会中大放光茫。台湾科技媒体中心13日与专家学者共同解析,台湾应该如何看待新的AI模型、DeepSeek的资安疑虑等。臺湾师范大学图书资讯所特聘教授曾元显指出,臺湾在此次浪潮中,投入的算力、人力、与数据,显然都不够。算力受限于电力,可以考量租用国外如美国的算力;人力则应多培养基础研究的工程、科学人员,给予足够的诱因;数据则需要大刀阔斧的投资与募集臺湾的语言资料。

曾元显分析,反覆编辑校正过的书籍资料,而有极大量高品质的文件,才能训练出优良的大型语言模型,中国大型语言模型给出版社的版权费约为购买三年授权,每十万字5000人民币,欧美则是每十万字5000美元,这是臺湾AI公司可以参考的价格。

国立政治大学应用数学系教授兼教务长蔡炎龙指出,有关DeepSeek的资安疑虑,真的该担心的是,DeepSeek不一定刻意造成,但会自然出现的状况。就是在中文的训练中,虽然DeepSeek没有公开训练资料,但可以预期,比起繁体中文,简体中文在DeepSeek的比例很可能比 ChatGPT、Llama 等模型还更高,这会造成即使不是刻意,也会把想法、价值观等等,潜移默化影响了常常使用DeepSeek的人。

国立高雄科技大学电机工程系教授戴鸿杰则认为,虽然DeepSeek在相对算力局限下的技术创新,让全球研究人员已重新检视降低模型开发和训练成本的重要性和可能方向,对台湾来说,除了基于更趋成熟的 AI 模型与训练技术持续深化更在地的服务,仍应在人才培育以及基础建设上投入更多的关注。

戴鸿杰认为,从DeepSeek的崛起显示AI研究团队的成立、人才培育、算力资源投入以及开放的重要性。DeepSeek的团队不仅有AI专家,还有擅长系统底层优化和高效能计算的工程师等,这种跨领域的合作是DeepSeek能持续性改善、研发和整合出新的突破性演算法与技术的关键。

#DeepSeek #AI #算力 #臺湾 #训练