Page 65 - My FlipBook
P. 65
Brochure 2020

我們在 2019 年有關知識獲取的另一項研究工作,是開發 我們提出了 H-FND,這是一種階層式的去噪框架(請參
一種在遠程監督下,達到排除錯誤樣本的方法。監督式 見圖二)。 H-FND 包含多個步驟,用以確定每一筆自動產
機器學習技術都需要一組訓練數據,但是標記訓練數據
在時間和金錢上都很昂貴。遠程監督是生成數據的一種 生的訓練樣本是否應保留、丟棄或修改成特定關係的陽
自動化作法。在遠程監督中,我們利用已有的知識庫以 性資料(Positive Sample)以提供更好的訓練資料。我們
字串比對的方式,對應到語料庫,藉以收集要提取關係 在 SemEval-2010 上進行了實驗,並設定多種不同的偽陰
的上下文資訊。該過程會導致為數不少的偽訓練數據, 性資料比率。我們的結果表明,即使在高達 50%的偽陰
特別是偽陰性資料(False Negative Sample)。若用於訓 性資料之下,H-FND 也有能力進行大部分的修復工作,
練,會大幅降低最終模型的性能。為了克服這個問題, 保持穩定的 F1 分數。

圖二: H-FND 的整體架構。

63
   60   61   62   63   64   65   66   67   68   69   70