鸿海宣布,旗下鸿海研究院推出首款繁体中文AI大型语言模型(LLM)FoxBrain。此模型原为内部应用而设计,涵盖数据分析、决策辅助、数学、推理解题等功能,还能针对台湾使用者的语言风格进行优化,后续将对外开源分享,且未来将透过导入AI大型语言模型,优化智慧制造、智慧电动车、智慧城市等三大平台的数据分析效率,进一步提升公司营运效益。

据悉,鸿海研究院人工智慧研究所在FoxBrain训练过程中,使用120张H100 GPU,并透过NVIDIA Quantum-2 InfiniBand网路进行扩展,仅花约四周时间完成,相较于近期其他公司所推出的推理模型,实现更高效率,更低成本的模型训练方式。同时,FoxBrain採用Meta Llama 3.1为基础架构,拥有70B参数,在TMMLU+测试资料集,大多数领域优于国内相同规模的Llama-3-Taiwan-70B,尤其是数学与逻辑推理方面。

鸿海说明,FoxBrain以自主研发方式稳扎稳打把每个环节做好,在运用有限的算力资源下仍能达到接近世界顶尖AI大模型的效益,并显示台湾科技人才在AI大模型领域也能与国外人才并驾齐驱。

鸿海补充,在模型训练过程中,NVIDIA提供Taipei-1超级电脑的支持以及技术谘询,使鸿海研究院透过使用NeMo顺利完成模型训练;而FoxBrain不仅是鸿海AI研发的重大突破,也为台湾AI产业发展树立新标竿,将在更多场景中发挥影响力,推动企业数智化转型与全球产业升级。

#语言 #鸿海 #模型训练 #模型 #鸿海研究院