眼看生成式AI市场竞争日渐激烈,OpenAI加紧脚步推陈出新,近日发表最新AI模型GPT-4o,不仅能接收文字、影像、语音指令,且AI运算比上一代快1倍,语音对答速度媲美真人对话,甚至能充当口译员。
OpenAI技术长穆拉蒂(Mira Murati)13日于线上直播发表会上表示,GPT-4o无论在文字、影像、语音的AI运算上皆「大幅加快速度」。她表示GPT-4o的最后一个字母来自「omni」,意指具备全方位功能满足所有使用者需求,不仅能处理50种语言指令,且速度比GPT-4 Turbo快1倍,成本只有一半。
OpenAI研究员Mark Chen表示,GPT-4o能根据使用者脸部表情分析情绪,还具备更强大的语音对话能力,最快能在232毫秒内回答使用者语音提问,媲美真人对话速度。
Mark Chen在线上发表会展示如何利用GPT-4o为孩子讲床边故事,且GPT-4o还能因应不同要求随时切换语调,就连用歌唱方式说故事也不成问题。GPT-4o对话如流的语音性能也能充当口译员,让讲义大利文的穆拉蒂与讲英文的Mark Chen顺利对话。
GPT-4o即日起开放ChatGPT Plus及Team付费订户使用,随后服务对象将扩大至Enterprise企业用户,预计20日起开放所有免费用户使用,但免费用户的使用次数受限。
2022年11月OpenAI推出第一代ChatGPT后,随即成为史上下载次数成长最快的应用程式,如今每周经常性用户量已达1亿人。这段期间AI新创公司接连加入战局,但社会大眾对AI认知有限,令不少人担心AI发展过快。
穆拉蒂表示OpenAI推出GPT-4o的目的之一就是「揭开AI神秘面纱」,让所有人都能实际体验AI运算。OpenAI也在13日推出桌机版ChatGPT,同样是希望扩大用户群。
发表意见
中时新闻网对留言系统使用者发布的文字、图片或檔案保有片面修改或移除的权利。当使用者使用本网站留言服务时,表示已详细阅读并完全了解,且同意配合下述规定:
违反上述规定者,中时新闻网有权删除留言,或者直接封锁帐号!请使用者在发言前,务必先阅读留言板规则,谢谢配合。