隨著電腦計算能力的提升,各家科技巨頭不約而同都會藉著發表會、開發者大會展現他們在 AI(人工智慧)領域的最新成果。在今(美國時間 5 月 7 日)日展開的 Build 開發者大中,微軟就展示了「對話式 AI」(conversational AI)的願景,讓人們提前體驗了更智慧的 AI ;從功能上來看,跟 Google I/O(開發者大會) 2018 年展示的 Google Duplex 似乎有異曲同工之妙。

微軟 CEO 薩蒂亞·納德拉(Staya Nadella)在 Build 大會中,針對當前的 AI 語音助理的功能,在 multi-turn、multi-domain 以及 multi-agent 方面需要改進。Nadella 指出,multi-turn 的意思是指,人與人之間的連續性對話十分複雜,大多牽涉一連串相關的內容,但是目前的語音助理服務大多只能理解片段的命令式問句,無法理解一整篇對話內容的脈絡;第二,可能你所向語音助理提起的問題,涉及多個領域(multi-domain)(例如詢問「今天中午會議的時候,是否可以在戶外用餐?」這時語音助理必須要知道你中午會議的預訂地點以及當地的天氣預報,並且提供你正確的建議),這也是每次使用者都必須要利用重覆的指定命令(例如 Hey, Siri、OK, Google )來喚醒語音助手的原因之一;第三,當前不同的語音助理之間是無法互動的,根據你使用的平台,你可以使用到的語音助理不同,而各自的功能也不一樣,但為了要提供人們更為全面的幫助,若語音助手之間無法共同提供協助,將是不合理的。

針對當前 AI 語音助理普遍的缺點,微軟提出了「對話式 AI」(conversational AI)的願景。得以發展出這類服務,事實上是基於微軟在 2018 年五月收購 Semantic Machines 的基礎。透過以下影片,可以提前預覽一下「對話式 AI」能對你我帶來的幫助。

Microsoft’s Semantic Machines Showcases New Conversational AI Technology

根據影片展示的內容,使用者可以跟 AI 語音助理以連續性的對話來請它替你完成一些例行性的工作,例如在向你報告一整天的行程之後,當你發覺當中有需要調整之處,不需要多次喊出特定的語音命令來請它完成特定任務(例如修改行事曆某一行程的預定時間),而只需要透過連續性的對話,就能讓具備「對話式 AI」技術的語音助理接續替你完成一件又一件的小任務,其中包含「調整行事曆行程」、「了解特定人員是否有收到會議通知、若無,可進一步寄送會議通知給特定人員」、「詢問特定會議地點在指定時間的天候狀態」等等,對話過程相比當前人們跟語音助手之間的對話自然且簡單不少,使用者也不需要特別記憶一些啟動語音助理特定功能的指令。就此來看,擁有對話式 AI 技術的語音助理或類似服務,將更為「人性化」。

微軟指出,理論上這項技術可被運用到日常生活中任何需要「對話」的場景中,來讓 AI 對人們帶來更多幫助。他們也允諾將會陸陸續續將此技術運用到所有「對話式 AI」產品中,而當中也包含了 Cortana。

(中時電子報)

#微軟 #Build #AI #人工智慧