馬偉雲的首頁

副研究員 | 馬偉雲

Research Descriptions

我們利用深度學習(Deep Learning)從事文字生成、聊天機器人、知識建構與推論、自然語言處理的研究，兼顧理論與應用，具體研發項目如下：

1. 廣告文案或新聞的自動生成

當輸入是一款手機的規格表，系統能自動生成出一篇具有說服力的廣告文案。或是當輸入是一場NBA的比賽數據表，系統能自動生成出一篇緊張刺激的播報新聞。我們希望透過深度學習當中的增強式學習(Reinforcement Learning)以及語言模型，打造一個這樣的文字生成系統，能夠一方面忠於輸入的表格內容，另一方面能發揮創造力，寫出多變化又文情並茂的文章。

2. 不限主題的閒聊機器人

即所謂 Chitchat Chatbot，也就是沒有特定目的的聊天. 目前這類型的bot大多數的作法是利用深度學習當中的seq-to-seq model來建構，但是，這樣的作法通常無法產生有意義或是較為深入的回應，多數會流於插瞌打渾或是賣萌。其中的關鍵，在於bot缺少了對於聊天主題相關的基本常識，就像是user要跟bot討論劉德華，bot應該對劉德華的各個fact(身份，作品...)有足夠認識，回的response才會豐富有意義，不然巧婦難為無米之炊，沒有知識就不容易產生有意義的回應，我們希望將grounded knowledge以及更豐富的語義訊息encode在model之中。我們透過深度學習當中的增強式學習(Reinforcement Learning)，已經訓練出一個不限主題的LINE閒聊機器人-詞庫小妍(LINE官方帳號：@359mcmgs)。

3. 自動知識學習系統

我們知道新的知識會夜以繼日的不斷產生，一個具有AI能力的系統最重要的功能之一就是能夠從大量的資料當中，分析資料，加以理解，組織成結構化知識。我們實驗室過去已經開發了人類的知識網(E-HowNet)，打下堅實基礎，此專案的目標是進一步加以擴張，利用深度學習技術將關鍵的關係三元組合從閱讀的文章中自動抽取出來，如 (”哈登” ，MemberOf，”火箭隊”) 或是 (“麥特載蒙”，PlayerOf，”心靈捕手”)等等。

4. 事實推論或事件預測系統

對於一個新事物，人們往往會根據基本常識、已知的事實、經驗的法則等等進行新事物的推測，包含事實或是事件的推論，例如以下的事實推論：已知A說中文，A又是B的哥哥，那麼很高的機率B也會說中文。又例如以下的事件推論：“買麵包”後會有很高的機率會在近期“吃麵包”。在一個龐大的文本或是複雜的知識圖譜當中，推論的關係往往數量龐大，有時甚至複雜到超越人力所能規範與理解，我們希望藉由深度學習技術能自動化的在文本或是知識圖譜當中進行新事物的推測。