DeepSeek以遠低大型AI模型公司硬體的成本,發展出類似效能的模型,引起市場對高算力需高投資說法的疑慮。AI晶片龍頭輝達股價重挫近17%,市值蒸發5888億美元,輝達發出聲明,指出DeepSeek的運算符合美國出口限制,且推論仍需要大量輝達的GPU。
大陸AI模型公司DeepSeek最新的AI模型訓練成本僅560萬美元,反觀AI模型龍頭OpenAI的GPT模型訓練成本卻超過1億美元,雖然DeepSeek的模型是由既有模型重新訓練而成,但也讓市場認為AI模型是否不需要設置太多的硬體,以降低資本支出。
輝達隨即發表聲明,表示DeepSeek展現出的成果,顯示出如何用廣泛可利用的模型,去建立新的模型,其運算也完全符合美國的出口管制,但仍強調,模型的推論仍需要大量輝達的GPU以及高效能的網路。
DeepSeek的論文指出,最新模型DeepSeek-R1僅使用約2000張輝達的H800的GPU,該晶片算力符合美國在2022年的出口管制措施,因此市場傳出即使限制晶片算力,仍擋不住大陸AI在軟體的發展。
發表意見
中時新聞網對留言系統使用者發布的文字、圖片或檔案保有片面修改或移除的權利。當使用者使用本網站留言服務時,表示已詳細閱讀並完全了解,且同意配合下述規定:
違反上述規定者,中時新聞網有權刪除留言,或者直接封鎖帳號!請使用者在發言前,務必先閱讀留言板規則,謝謝配合。