大陆AI新创公司DeepSeek(深度求索)开发的AI大模型,绕过了美国巨头辉达的CUDA(统一运算架构),这为未来DeepSeek与大陆国产GPU晶片的相容性做好准备。
据快科技、Tom's Hardware报导,辉达开发的CUDA能大幅降低研发大模型的难度,并获得全球开发商的广泛应用,让辉达在AI晶片领域稳居龙头地位。然而,最新发现指出,DeepSeek在使用辉达H800晶片进行训练时,採用的是辉达底层硬体指令PTX(Parallel Thread Execution)语言,而非高阶编程语言CUDA。
PTX编程语言极其复杂且难以维护,因此业界通常偏向于使用CUDA等高级编程语言。
北京航空航天大学副教授黄雷表示,DeepSeek绕过CUDA意味着其能够根据GPU驱动函数直接开发创新,以实现更精细的操作。
简而言之,DeepSeek将优化提升至极致境界。
DeepSeek拥有擅长撰写PTX语言的内部开发人员,如果未来改用大陆国产 GPU,DeepSeek将能更得心应手地处理硬体相容性问题。他们只要了解硬体驱动提供的基本函数介面,即可仿效辉达GPU硬体编程介面编写相关程式,让自家的AI模型更容易与大陆本土硬体兼容。
发表意见
中时新闻网对留言系统使用者发布的文字、图片或檔案保有片面修改或移除的权利。当使用者使用本网站留言服务时,表示已详细阅读并完全了解,且同意配合下述规定:
违反上述规定者,中时新闻网有权删除留言,或者直接封锁帐号!请使用者在发言前,务必先阅读留言板规则,谢谢配合。