辉达推出Cosmos「基础」训练模型,该模型可产出画面逼真的视讯,可用于训练机器人和自驾车,所花费的成本将比採用传统数据还低得多。

藉由创造科技业所熟知的「合成」训练数据,这些模型可以帮助机器人和汽车瞭解物理世界,此方式就类似大型语言模型(LLM)帮助聊天机器人以自然语言生成回应。

用户可以透过给予Cosmos一段文字描述,就可产出遵循物理定律世界的影片。此方式的成本比当前收集数据便宜许多,因为以往若要训练自动驾驶车,企业透过车队行驶在街道上取得资料,若要训练人形机器人,通常必须透过真人重复地执行动作来进行训练。

不过,黄仁勋也警告,Cosmos模型要达到「ChatGPT时刻」(ChatGPT moment)前,还需要更多大量的数据才行。

根据规划,Cosmos将採取类似Meta Platforms Llama3语言模型的「开放授权」方式提供,后者已在科技业广泛採用。

黄仁勋说:「我们期盼(Cosmos)能为机器人和工业AI领域做出如同Lama3为企业AI所做的贡献。」

#世界 #训练 #Cosmos #机器人和 #黄仁勋