阿里雲推出兩款大規模視覺語言模型具中英圖文識別能力

Qwen-VL和Qwen-VL-Chat是支持中英文語言的視覺語言模型，以阿里雲之前開源的通義千問70億參數模型Qwen-7B為基礎語言模型研發，除具備中英文圖文識別、描述和問答對話能力，更新增視覺定位和圖像文字理解能力。

Qwen-VL及基於這一模型微調的對話模型Qwen-VL-Chat可用於知識問答、圖像標題生成、圖像問答、文件問答、細粒度視覺定位等多種場景。例如用戶可拍下醫院樓層導覽圖，問Qwen-VL Chat「外科在哪層？」、「耳鼻喉科去哪層？」，Qwen-VL會根據圖片訊息給出文字回覆。

為進一步助力AI技術普惠，全球學術、研究及商業機構均可免費獲取上述模型的代碼、模型權重和文件。對於商業應用需求，月活躍用戶少於1億的公司可免費使用模型，用戶數超過該量級的企業可向阿里雲申請許可證。

#全球 #Qwen #VL #模型 #視覺

留言規則

中時新聞網對留言系統使用者發布的文字、圖片或檔案保有片面修改或移除的權利。當使用者使用本網站留言服務時，表示已詳細閱讀並完全了解，且同意配合下述規定：

請勿重覆刊登一樣的文章，或大意內容相同、類似的文章
請不要刊登與主題無相關之內容
發言涉及攻擊、侮辱、影射或其他有違社會善良風俗、社會正義、國家安全、政府法令之內容，本網站將會直接移除
請勿以發文、回文等方式，進行商業廣告、騷擾網友等行為，或是為特定網站、blog宣傳，一經發現，將會限制您的發言權限或者封鎖帳號
為避免留言系統變成發洩區和口水版，請勿轉貼新聞性文章、報導或相關連結
請勿提供軟體註冊碼等違反智慧財產權之資訊
禁止發表涉及他人隱私、含有個人對公眾人物之私評，且未經證實、未註明消息來源的網路八卦、不實謠言等
請確認發表或回覆的內容（圖片）未侵害到他人的著作權、商標、專利等權利；若因發表或回覆內容而產生的版權法律責任將由使用者自行承擔，不代表中時新聞網的立場，請遵守相關法律規範

違反上述規定者，中時新聞網有權刪除留言，或者直接封鎖帳號！請使用者在發言前，務必先閱讀留言板規則，謝謝配合。