Page 87 - My FlipBook
P. 87
Brochure 2020
我們的研究將著重在下列議題:(1)如何通過語用推論來導引用戶快速找到特定答案。(2)
如何通過多段搜尋 (multi-hop search) 來尋找散佈在各種文本上的相關段落。(3)如何添
加及利用從不同的外部知識庫(例如 Freebase,Wikidata 等)中提取的中間線索。(4)如
何從 WordNet / ConceptNet 提取外部知識(例如普通常識、領域知識等),以增強多段推
論能力。(5)如何處理自然語音,並緊密耦合文本處理和語音識別模組。
在本專案的第一年(2020 年),我們將基於預先提取的維基百科頁面,完成一個特定領域
的基準系統。預期完成下列項目:(1)設計一個統一的框架,以整合各種尋求答案的機制,
(2)設計各種答案生成模組以模仿人類推理過程,以及(3)利用語音和文本線索,將文
本處理和語音識別模組緊密耦合。
在本專案的第二年(2021 年),我們將完成可在多領域中進行多段推論的系統。預期完成
下列項目:(1)以多段搜索演算法,獲取散佈在不同文本上的相關支持證據,(2)將一
個複雜的問題分解為一系列簡單的問題,(3)根據提取的支持證據進行多段推論,(4)
進行領域調適 (domain adaptation),以及(5)檢測並消除自發性語音中重複及不流暢的部
分,以改善自然語音識別。
在本專案的最後一年(2022 年),我們將完成一個開放領域系統,能夠以增強的常識推理
能力,同時處理維基百科頁面和其他在線文本。預期完成下列項目:(1)可根據普通常識
進行推理(將引入適當的中間目標),(2)在對話管理系統中進行語用推理,(3)增強
可解釋性(即產生相關的推論過程),以及(4)藉由對抗性學習 (adversarial learning) 來
增強自然語音識別的強健能力 (robustness)。
為了展示我們所提出做法的優勢,我們將持續參加由科技部主辦的「科技大擂台: 與 AI
對話」競賽、以及國際上知名的機器閱讀問答競賽 (Machine Reading for QA (MRQA) shared
task)。
85
我們的研究將著重在下列議題:(1)如何通過語用推論來導引用戶快速找到特定答案。(2)
如何通過多段搜尋 (multi-hop search) 來尋找散佈在各種文本上的相關段落。(3)如何添
加及利用從不同的外部知識庫(例如 Freebase,Wikidata 等)中提取的中間線索。(4)如
何從 WordNet / ConceptNet 提取外部知識(例如普通常識、領域知識等),以增強多段推
論能力。(5)如何處理自然語音,並緊密耦合文本處理和語音識別模組。
在本專案的第一年(2020 年),我們將基於預先提取的維基百科頁面,完成一個特定領域
的基準系統。預期完成下列項目:(1)設計一個統一的框架,以整合各種尋求答案的機制,
(2)設計各種答案生成模組以模仿人類推理過程,以及(3)利用語音和文本線索,將文
本處理和語音識別模組緊密耦合。
在本專案的第二年(2021 年),我們將完成可在多領域中進行多段推論的系統。預期完成
下列項目:(1)以多段搜索演算法,獲取散佈在不同文本上的相關支持證據,(2)將一
個複雜的問題分解為一系列簡單的問題,(3)根據提取的支持證據進行多段推論,(4)
進行領域調適 (domain adaptation),以及(5)檢測並消除自發性語音中重複及不流暢的部
分,以改善自然語音識別。
在本專案的最後一年(2022 年),我們將完成一個開放領域系統,能夠以增強的常識推理
能力,同時處理維基百科頁面和其他在線文本。預期完成下列項目:(1)可根據普通常識
進行推理(將引入適當的中間目標),(2)在對話管理系統中進行語用推理,(3)增強
可解釋性(即產生相關的推論過程),以及(4)藉由對抗性學習 (adversarial learning) 來
增強自然語音識別的強健能力 (robustness)。
為了展示我們所提出做法的優勢,我們將持續參加由科技部主辦的「科技大擂台: 與 AI
對話」競賽、以及國際上知名的機器閱讀問答競賽 (Machine Reading for QA (MRQA) shared
task)。
85