大陆AI新创公司DeepSeek(深度求索)开发的AI大模型,绕过了美国巨头辉达的CUDA(统一运算架构),这为未来DeepSeek与大陆国产GPU晶片的相容性做好准备。

据快科技、Tom's Hardware报导,辉达开发的CUDA能大幅降低研发大模型的难度,并获得全球开发商的广泛应用,让辉达在AI晶片领域稳居龙头地位。然而,最新发现指出,DeepSeek在使用辉达H800晶片进行训练时,採用的是辉达底层硬体指令PTX(Parallel Thread Execution)语言,而非高阶编程语言CUDA。

PTX编程语言极其复杂且难以维护,因此业界通常偏向于使用CUDA等高级编程语言。

北京航空航天大学副教授黄雷表示,DeepSeek绕过CUDA意味着其能够根据GPU驱动函数直接开发创新,以实现更精细的操作。

简而言之,DeepSeek将优化提升至极致境界。

DeepSeek拥有擅长撰写PTX语言的内部开发人员,如果未来改用大陆国产 GPU,DeepSeek将能更得心应手地处理硬体相容性问题。他们只要了解硬体驱动提供的基本函数介面,即可仿效辉达GPU硬体编程介面编写相关程式,让自家的AI模型更容易与大陆本土硬体兼容。

#DeepSeek #辉达 #CUDA #GPU #AI