科技部25日舉辦「AI語音數據資料集」上線發表會暨「科技大擂台」,將開放400小時語音資料庫供產官學免費使用,加速台灣中文語音對話科技的開發,年底盼開放至2,000小時。PTT創辦人杜奕瑾說,光是逐字稿軟體將商機無限,未來語音辨識的應用與發展值得期待。

科技部次長許有進指出,科技部是與教育廣播電台與警察廣播電台合作,攜手宣布 AI 語音數據資料集即將上線釋出。他指出,科技大擂台就是提供一個長期研發的平台,今年大家沒有解決語音辨識的困難、那明年再來,透過集體研發,過程中產生的技術與專利,有望在後續解決其他科技問題。

許有進表示,資料庫的語句已經過標記與辨識,就可大幅縮短語音發展所需人力與時間,降低相關技術的發展門檻,期許吸引更多不同產業、學界投入,讓台灣在未來的數位轉型更加順利。

Taiwan AI Labs創辦人杜奕瑾則指出,台灣面臨數位轉型跟創新需求,下一個十年在A-IoT連結,但是整體研發過程極為漫長,他以微軟、Google都做出物聯網裝置,透過語音控制家電,但現在來看未能成功打入居家市場,因還有很多使用技術與門檻未能觸及。

杜奕瑾說,語音資料庫的釋出可讓語音辨識更進步,加速人機互動體驗的創新應用,雖距理解人類說什麼還有段距離,但純粹在辨識就有許多應用商機。他舉例,現在語音辨識應用最廣泛的就是逐字稿APP,未來可能發展出AI記者,可透過神經網絡運算及機器學習,幫助未來使用者挑選新聞。

#科技 #科技部