中文版
English
研究員  |  簡立峰  
 
contact
vita
education
experience
interests
descriptions
activities
honors
grants
publications
Personal (New window)
 
 
 
 
 
Research Descriptions
 

        本人的研究興趣著重在資訊檢索,中文語音語言處理及網路探勘。相較於多數資訊檢索團隊,本人主持的研究有相當紮實的語言處理,語音辨認以及網路資源探勘與資訊檢索技術基礎。多年來本人參與中文剖析系統,語言模型,聽寫機以及搜尋引擎技術發展。這些經驗相當有助於資訊檢索及網路資訊探勘研究。95 及96 年間藉由對中文特性的掌握,本人發展高效率文件檢索演算法以及Csmart檢索系統,並成功技術移轉產業界。為了能利用龐大的網際網路資訊獲取語言知識以進而發展更先進檢索技術, 97 年間更研究多項自動擷取技術,包括可以以PAT-tree 為基礎自動抽取特定領域專有術語的關鍵詞抽取技術,可隨網路資源更新而自動調適的語言模型技術等。據此研發出一系統性方法以發展動態辭典建構技術,並獲得97年ACM SIGIR Best Poster Presentation Award。上述PAT-tree系列抽詞技術已受到廣泛引用,成為從大量中文文件抽取關鍵詞的代表性方法之一。

        近年本人研究多以網路資源探勘,特別是查詢紀錄以及網頁連接文字之知識擷取為主。2000年與學生一起發展利用網頁連結文字自動抽取查詢翻譯。這項技術使得很多網路查詢關鍵詞的雙語翻譯可以透過文件探勘技術獲得。此外,也發展一系列查詢紀錄探勘技術包括查詢分類,新查詢歸類等,以自動建構查詢分類典。這些技術是希望能結構化組織使用者的查詢語彙,擷取相關詞,歸類查詢類別等,部分成果已經發表在代表性會議與期刊,如WWW’04,ICDM’01,ICDM’02,ACM TOIS’04。

        本人曾獲得第一屆李國鼎青年研究獎, 6 次擔任ACM SIGIR 議程委員, IRAL 會議創始委員, ACM TALIP,CLCLP,IP&M等期刊編輯。

 
 
bg