Google中文語音搜尋辨識率之高,連講台灣國語都通,可是Google Assistant卻遲遲學不會中文而無法登台,連帶使Google Home沒有在台上市。對機器來說,為什麼說中文這麼難?

專精於自然語言處理的Google研究科學家宋雲軒表示,自然語言就是人平常使用的白話文,大量資訊透過自然語言為基礎的文字、語音流傳,是Google非常重視自然語言處理的原因,而自然語言更是Google許多服務如翻譯、Assistant的基礎。

如果跟Assistant問「台北的天氣如何」,它會先辨識出這幾個字,接著分析語意並拆解出天氣、地點、時間後,搜尋台北的溫濕度等氣候資料,再將資料轉成中文,合成語音讓機器回答台北天氣狀況。在這個過程中,斷詞/斷句結構、中文聲調、口音、上下文組成的,都會有所影響。

宋雲軒指出,比起英文,中文斷詞/斷句結構不明確、使機器難以了解中文,「下雨天留客天天留我不留」,斷句斷在不同的地方代表截然不同的意思,就是典型的例子,而英文只有一聲可是中文有四聲,不同的聲調都要處理,否則意思就不對,比如說發音都是ㄕ,詩詩與實施就完全不同。

至於方言與中文的交互作用也拉高機器學中文的難度,如用台語講「有省錢」聽起來跟中文的「五星級」差不多,另外,中文的語調、語氣對自然語言處理來說,幾十年來都是高難度的課題。

不過,中文語音搜尋已行之有年,對此宋雲軒表示,搜尋與Assistant的需求不同,語音搜尋通常只是找資料,問題簡單明確、問題之間不見得有關聯,但人跟Assistant對話內容複雜度高、問題之間常有關聯性,再牽扯上對機器來說困難度高的中文,難度加大,都是到目前為止Assistant還無法說中文的原因。

#資料