陆媒引述消息人士报导,阿里巴巴即将在4月第二周发布新模型Qwen3,这将是阿里巴巴在今年上半年最重要的模型产品。
报导指,在去年发布Qwen2.5后,阿里云内部的基础模型团队已开始推动Qwen3相关项目,但今年初大陆自研的人工智能大模型DeepSeek的爆红,改变了团队的部分想法与重心。
消息人士说,去年第四季,圈内已意识到模型的推理能力很重要,但还不能说是最重要的方向,DeepSeek爆红后,推理能力已成为绕不开的关键能力。而DeepSeek-R1发布后,阿里云基础模型团队把策略中心进一步着重于模型的推理能力。
发表意见
中时新闻网对留言系统使用者发布的文字、图片或檔案保有片面修改或移除的权利。当使用者使用本网站留言服务时,表示已详细阅读并完全了解,且同意配合下述规定:
违反上述规定者,中时新闻网有权删除留言,或者直接封锁帐号!请使用者在发言前,务必先阅读留言板规则,谢谢配合。