中文版
English
研究員  |  王新民  
 
contact
vita
education
experience
interests
descriptions
activities
invited_talk
invited_visit
honors
grants
publications
others
supervised
lab (New window)
 
 
 
 
 
Research Descriptions
 

我的研究興趣包括語音處理、自然語言處理、多媒體資訊檢索、機器學習及圖形識別。研究目標是開發多媒體音訊分析、抽取、辨識、索引及檢索技術。

在語音方面,我的研究著重在語者辨識、口語語言辨識、語音轉換、語音文件檢索/摘要。最近的研究成果包括一個基於最大交互訊息的GMM語音轉換架構、基於子空間的口語語言辨識、基於i-vector的語言模型技術。進行中的研究包括各種語言模型技術、基於子空間的口語語言辨識與語者辨識、GMM語音轉換的鑑別式訓練方法、富有表情的語音合成等。

在音樂方面,研究課題包括歌聲旋律抽取、音樂標籤預測、音樂情緒辨識、音樂檢索。最近的研究成果包括應用於音樂標籤預測的成本導向多標籤學習架構,基於多重標籤的音樂檢索技術、應用於音樂情緒辨識的聲學情緒高斯模型。我們的音樂標籤預測系統在2009 Music Information Retrieval Evaluation eXchange (MIREX2009)獲得第一,整合聲學與視覺情緒高斯模型的自動音樂影片生成技術則在ACM Multimedia 2012獲得Grand Challenge First Prize。進行中的研究包括各種音樂檢索技術的改良、情境感知音樂檢索與推薦、音樂結構分析與摘要、歌聲合成等。

 
 
bg