在許多實際的模式識別任務中存在著非同源資料的訓練問
題,同屬於某一類別的資料由於不同因素的影響也會存在較
大的差異,將這些資料簡單的混合訓練將增加模型的混淆度而導
致識別性能的下降, 而按不同因素劃分資料又將導致訓練資料
的稀疏。在語音識別系統的聲學模型建模中,這一問題尤為突
出,其影響因素主要包括不同說話人,不同的表達方式(如朗讀
式語音,口語式語音),不同的口音等等,如何充分利用訓練資
料而保留不同因素的差異資訊,即如何在保持模型的泛化性能的
同時保持模型的準確性是聲學模型建模面臨的一個挑戰。本講座
中將提出一種新的解決此類問題的思路,介紹了基於覆蓋的聲學
模型建模研究及相關實驗結果。