据外媒报导,深度求索(DeepSeek)在研发大模型时绕过了辉达的软硬体整合技术「统一计算架构」(CUDA)这道AI技术护城河,这种用新的演算法高效利用硬体层面加速,能提高模型效果。只要有足够擅长写PTX语言的内部开发者,就能让大陆开发的AI模型更容易适配中国国产GPU晶片,这让美国不少AI巨头们感受到极大的威胁。
据《快科技》报导,DeepSeek真的绕过了辉达的计算架构CUDA,北京航空航太大学黄雷副教授接受採访时表示,绕过CUDA意味着DeepSeek可以直接根据GPU的驱动函数做一些新的开发,从而实现更加细细微性的操作。
黄雷指出,譬如DeepSeek在多节点通信时绕过了CUDA,直接使用并行线程执行代码(Parallel Thread Excution, PTX),其最多只能实现以演算法的方式来高效利用硬体层面的加速。一旦速度变得更快,这就意味着别人的模型要训练10天,而DeepSeek只需要训练5天,那么就能给模型喂更多的资料,即能让模型在同等时间内看到更多的资料,间接提高模型的效果。
因此,透过PTX虽然可以进行更多专门的最佳化调整,但缺点是很难维持稳定,需要人力大量除错,因此也显示出 Deepseek 工程师的设计功力。
报导说,Deepseek 的出现,打破了硅谷巨头在人工智慧竞争中的军备竞赛局面,AI 开发或许不一定非要追求最强晶片和庞大晶片数量,透过精细的程式设计也能让低规设备跑出高效结果,这可能也是前日美国科技股市震盪的主要原因。
报导引述消息人士指出,DeepSeek拥有一些擅长写PTX语言的内部开发者,假如它之后使用中国国产GPU,其在硬体适配方面将会更得心应手,其只要瞭解这些硬体驱动提供的一些基本函数介面,就可以仿照辉达GPU硬体的程式设计介面去写相关的代码,从而让自家大模型更加容易适配国产硬体。
发表意见
中时新闻网对留言系统使用者发布的文字、图片或檔案保有片面修改或移除的权利。当使用者使用本网站留言服务时,表示已详细阅读并完全了解,且同意配合下述规定:
违反上述规定者,中时新闻网有权删除留言,或者直接封锁帐号!请使用者在发言前,务必先阅读留言板规则,谢谢配合。