AI晶片巨头辉达25日秀出全新AI模型Fugatto,可生成音乐和音讯,不仅能修改还会生成全新声音,此模型主要锁定音乐、电影和电玩制作人,但还没有公开发表的计画。
辉达的新模型能根据文本描述,生成音乐与音效,还能让声音产生新奇的变化,例如小号这种乐器会发出狗叫声。
此新模型与其他AI技术的差别在于,能吸收和修改既有音讯,像是将钢琴曲转换成人类歌声,或让录好的话语改变口音及情绪表达。
辉达的全新AI模型是照开放原始码数据训练,但是否公开以及公开方式,辉达表示还在讨论。
OpenAI 今年初推出影像生成工具Sora,脸书母公司Meta10月初发表类似工具Movie Gen,新创公司Runway开发Gen-3 Alpha,都是透过文本提示生成声音或影像,辉达的Fugatto也加入这个行列。
发表意见
中时新闻网对留言系统使用者发布的文字、图片或檔案保有片面修改或移除的权利。当使用者使用本网站留言服务时,表示已详细阅读并完全了解,且同意配合下述规定:
违反上述规定者,中时新闻网有权删除留言,或者直接封锁帐号!请使用者在发言前,务必先阅读留言板规则,谢谢配合。