Page 64 - My FlipBook
P. 64


智慧

畫 建構概念為本且具語義結合性的中文知識庫

Arti cial Intelligence Projects 計畫主持人:馬偉雲博士
計畫期程:2019/1~2022/12

我的研究團隊自科技部(MOST)獲得了一個為期四年 在項目的第一年(2019 年),我們主要專注於從原始文
(2019/1 ~ 2022/12)的人工智慧計畫。每年該項目獲 本中獲取知識和知識的表達。為了從原始文本中獲取知
得 MOST 撥款 23 萬美元。目的是建立一個能解決現實 識,我們提出一種新的模型 - GraphRel,這是一種端到端
問題並且支持台灣 AI 發展的中文知識庫。回顧歷史,在 的深度學習模型,使用圖卷積網絡(GCN)共同學習擷
2012 年,Google 以知識庫(知識圖譜)作為搜尋檢索的 取專有名詞和他們之間的關係(請參見圖一)。與以前研
額外資源,效能獲得大幅提升。從那時起,無論是在工 究的作法不同,我們考慮了專有名詞與關係之間的交互
業界還是在學術界,知識庫的建設引起了廣泛的關注, 影響,以兩階段來利用 GCN,可以更有效地擷取專有名
也成功開發和部署了各種知識庫應用程序。鑑於深度學 詞專有名詞和其交互關係。同時,我們也利用詞彙間的
習的快速發展,近來研究者多將知識庫的信息加以編碼, 語法結構作為文本的特徵,建立一個輸入文本的詞彙關
作為深度學習模型可以利用的形式,賦予其解決各種實 係圖,詞彙的訊息可藉由這樣的關係圖彼此傳遞,以達
際的應用問題的能力。 成設定的目標。與前人的研究相比,對擷取專有名詞交
互關係的效能上有了很大的改進。我們針對兩個公共數
開發實用且高質量的知識庫非常關鍵,但也充滿挑戰。 據集 - NYT 和 WebNLG 評估了 GraphRel。我們的結果表
涉及的實體數量可以達到數百萬,甚至數千萬。 因此, 明 GraphRel 保持高準確率,且大幅提升召回率。跟 2019
不可能手動建立知識庫,必須有自動建立的技術與機制。 年 最 好 的 技 術 相 比,GraphRel 在 NYT 和 WebNLG 的 F1
同時,還必須考慮知識庫的推理機制,包括因果關係和 分數均超越 2019 年最好的技術達 3.2%和 5.8%的相對進
推理過程,因此,必須仔細設計知識庫的表達形式和推 步幅度。
理能力。為了建立這種性質的實用知識庫,我們目前致
力於知識的自動擷取、表示、推理和應用。 我們已經開
發了英文和中文兩種版本的知識庫形式。前者可以跟其
他世界級的知識庫做比較,後者則用於構建中文知識庫
的種種實際應用,落實計畫的目標。

圖一: GraphRel 的整體架構。

62
   59   60   61   62   63   64   65   66   67   68   69