谷歌(Google)6日正式推出了多模態的大型語言通用模型Gemini。Gemini共推出3種版本,包含性能最強大的Ultra版模型、通用性最廣的Pro版,及可以在手機裝置上運作的Nano版。其中Nano版本可讓安卓(Android)系統的開發人員能藉此打造離線使用的人工智慧(AI)應用程式與功能。但目前僅先供谷歌旗下的Pixel系列手機搭載。

Gemini是使用谷歌自行開發的晶片「TPU」訓練而成,可以同時支援文字、圖片和聲音的輸入。在32項AI測試中,有30項的評分超越了OpenAI的GPT-4V。谷歌執行長皮查伊(Sundar Pichai)強調,Gemini是谷歌有史以來最強大、也最通用的模型。

三大模型裡,Gemini Ultra是專為資料中心和企業應用程式的複雜任務而設計,但谷歌目前正對Ultra版進行信任和安全測試,現僅挑選特定企業用戶或開發者進行Ultra版試用,預計2024年初才正式推出。

Gemini Pro則自6日起與谷歌的聊天機器人「Bard」英語版本整合,可在美國、亞洲和非洲等170多個地域使用,可以如同OpenAI的GPT-4,讓開發者整合到不同應用當中。谷歌預計從13日開始,開放企業透過旗下GCP Vertex AI或Google AI Studio存取Gemini Pro模型。

Gemini Nano則分為2個版本:分別是18億個參數的Nano-1和32.5億個參數的Nano-2,專為終端設備而設計,以優化AI在安卓系統中的性能。谷歌表示,Nano版甚至不需要網路,單靠手機上的TPU晶片也能運作,目前先支援Pixel 8 Pro手機,未來再進一步擴大支援其他手機。

與此同時,七國集團(G7)領袖於6日召開視訊會議時,達成了防止AI濫用的「廣島AI進程」國際規則框架最終協議,成為首份對所有AI開發人員及用戶應遵守的全面國際規則。此協議不具法律約束力,具體規定任由各國自行發布。主要規範開發人員及用戶應避免AI發布虛假資訊,並要求推進「數位浮水印」等技術開發,從而能識別生成式AI的內容。

#Pro #版本 #模型 #通用 #開發