啟動元宇宙的鑰匙:超級AI客服
轉載自:https://www.cw.com.tw/article/5119119
向戲劇、行為科學取經,建構語音情緒演算模型
「在機器學習中,如何取得資料是第一個難關。為了建立台灣中文對話的情緒演算模型,團隊在五年前先透過戲劇系演員協助,演繹人們對話時的各種情境,再結合行為科學家的研究理論,輔助建立模型。」清華大學電機工程系副教授李祈均說道。
需借力戲劇系演員,是因國外雖多有情緒演算研究,但受限於個資問題,即便研究單位願意分享模型成果,在無法結合原始資料分析下,應用價值有限。而要從真實世界裡從頭累積華文世界的資料庫,又曠日廢時,因此才想到這個方法。
即便如此,李祈均教授的團隊仍耗費四年時間,在累積100多個小時的對話數據庫後,並整併行為科學理論才得以建構出有效中文情緒辨識模型。
「這個難關,直到近兩年Podcast盛行,才讓研究團隊思考能以比較短時間內,大量取得更多元的對話情境數據。」李祈均指出,以往做情緒演算模型時,往往只有一、兩萬句對話,頂多十幾個小時的資料量,但在國外最新以Podcast為數據來源的研究中,則以至少400小時為目標。
李祈均分享,目前團隊也和該研究機構合作,取材中文的Podcast節目,並整合自動語音辨識、語意分析處理、多模態融合、個人化模型的演算法,同步整合個體空間行為表徵學習,透過深度網路構建情緒辨識模組。
清華大學電機工程系副教授李祈均
表徵學習技術,讓輸出增添無限可能
而除了情緒演算外,要建構中文的超級AI客服,仍有賴於表徵學習(Representation Learning)的核心技術。
「在AI客服的應用上,無論輸入的資料是文字、語音、圖像或影片,都需將數據轉換成能被機器學習的向量與實數,而表徵學習就是在機器學習使用表徵的同時,也學習如何提取特徵的技術。」清華大學資訊工程系教授吳尚鴻說道。
就因表徵學習具備「學習如何學習」的能力,除了取代過去需仰賴專業人員、耗費大量時間手動提取特徵,並「輸入」數據的時間,應用在「輸出」時,更有助於開發出原生文字、原生圖片、原生語音、原生影片,為線上消費環境提供良好的使用者體驗。
清華大學資訊工程系教授吳尚鴻
自然語言學,攻克語言巴別塔
但要建構中文世界的超級AI客服,要攻克的最大關卡,仍是語言這座巴別塔。畢竟,機器學習霸權的母語屬拼音系統,並透過程式編碼樹立高牆,中文世界的研究要後來追上,看似不易。
不過,這在研究自然語言處理(Natural Language Processing , NLP,或稱Computational Linguistics,CL)三十多年的臺大資訊工程系教授陳信希眼中,卻不是一件難事。
「不管是拼音組成的英文單字,或是象形文字的中文單字,要對電腦產生意義,都需要轉化成有意義的形式,也就是所謂的表徵。」陳信希分享,語言在電腦中的表現方式,從早期的(symbolic representation)、中期的分佈式表徵(distributional representation),演進到近年來在深度學習中廣為使用的分散式表徵(distributed representation),都需先把生活中的事物化為表徵,再透過不同方式運算。
更何況,從單字到句子,無論是中文或英文,只要能從名詞、動詞、形容詞和副詞組成的句型中,判斷出人事時地物,就能化成自然語言學所需的資料。
「尤其,深度學習的分散式表徵,使用低維度高稠密向量,以預測方式取代過去分佈式表徵的計數方式,大大提升了機器學習任務的效能,也讓自然語言學有了大幅躍進。」陳信希說道。
臺大資訊工程系特聘教授陳信希
確保資訊自主性,才能成就元宇宙沃土
在深度學習技術的推進下,也讓未來的AI客服有了全新想像。
「目前,除了線上翻譯、聊天機器人外,自然語言學也已應用在輿情分析、病歷探勘、金融科技、健康照護、法律諮詢、烹飪教學等領域,在加入深度學習後,未來潛力可期。」陳信希說道。
當研究團隊運用深度學習,在取得資料進行數據運算時,也讓學研界自省在一項技術研究初期,思考該技術發展後可能衍生的問題與爭議,並加以改善、防堵。
「當人們享受Google、Facebook帶來的便利時,伴隨大數據演算而來的大量廣告推播,也讓民眾的被監控感日益強烈,並衍生出資訊自主等議題。」吳尚鴻指出,在消費者對資訊安全日益重視後,杜絕平台收集個人資料的軟體也會應運而生,例如只要在手機裡下載某個App,就可防止平台收集你的資料。
「當資訊安全性與自主權獲得保障後,人們才可以安心沉浸在多媒體建構的虛擬世界中,藝術創作者也才能安心創作,不怕被侵權。」李祈均說道。
從以自然語言學,將人類語言轉換成電腦的語言,並透過深度學習,催生出多元的AI客服應用。未來的超級AI客服,除了是打開元宇宙的鑰匙之一,相關技術衍生的資訊安全問題,更是人們往返實體與虛擬世界中,最重要的心理安全閥。
詳細文章請見
啟動元宇宙的鑰匙:超級AI客服 https://www.cw.com.tw/article/5119119