眼看生成式AI市场竞争日渐激烈,OpenAI加紧脚步推陈出新,近日发表最新AI模型GPT-4o,不仅能接收文字、影像、语音指令,且AI运算比上一代快1倍,语音对答速度媲美真人对话,甚至能充当口译员。

OpenAI技术长穆拉蒂(Mira Murati)13日于线上直播发表会上表示,GPT-4o无论在文字、影像、语音的AI运算上皆「大幅加快速度」。她表示GPT-4o的最后一个字母来自「omni」,意指具备全方位功能满足所有使用者需求,不仅能处理50种语言指令,且速度比GPT-4 Turbo快1倍,成本只有一半。

OpenAI研究员Mark Chen表示,GPT-4o能根据使用者脸部表情分析情绪,还具备更强大的语音对话能力,最快能在232毫秒内回答使用者语音提问,媲美真人对话速度。

Mark Chen在线上发表会展示如何利用GPT-4o为孩子讲床边故事,且GPT-4o还能因应不同要求随时切换语调,就连用歌唱方式说故事也不成问题。GPT-4o对话如流的语音性能也能充当口译员,让讲义大利文的穆拉蒂与讲英文的Mark Chen顺利对话。

GPT-4o即日起开放ChatGPT Plus及Team付费订户使用,随后服务对象将扩大至Enterprise企业用户,预计20日起开放所有免费用户使用,但免费用户的使用次数受限。

2022年11月OpenAI推出第一代ChatGPT后,随即成为史上下载次数成长最快的应用程式,如今每周经常性用户量已达1亿人。这段期间AI新创公司接连加入战局,但社会大眾对AI认知有限,令不少人担心AI发展过快。

穆拉蒂表示OpenAI推出GPT-4o的目的之一就是「揭开AI神秘面纱」,让所有人都能实际体验AI运算。OpenAI也在13日推出桌机版ChatGPT,同样是希望扩大用户群。

#真人 #AI运算 #语音 #速度 #MARK