Institute of Information Science Academia Sinica
Topic: When DRBL meet Hadoop : cluster deployment, performance measurement and its related application in bioinformatics
Speaker: Mr. Jazz Yao-Tsung Wang (國家高速網路與計算中心副研究員,軟體技術組副組長)
Date: 2012-05-04 (Fri) 14:00 – 15:00
Location: Auditorium 106 at new IIS Building
Host: Jan-Ming Ho

Abstract:

Hadoop 是一套撰寫海量資料分析的軟體平台,融合了傳統電腦叢集的平行運算概念與分散式系統的容錯概念,是雅虎、臉書與推特等雲端服務提供者背後的關鍵技術。然而 搭建大型Hadoop 叢集需要許多搭建電腦叢集的背景知識,因此此次演講將簡介目前自行搭建Hadoop 叢集會使用哪些工具來進行輔助,並針對國網中心所研發之企鵝龍(DRBL)如何與Hadoop 整合進行經驗分享。其次,會介紹一些效能量測工具與常見的效能指標供後續分析Hadoop 應用程式在做最佳化改良時的參考依據。最後將分享一些關於Hadoop 在生物資訊應用的自由軟體專案。


BIO:

王耀聰 Jazz Yao-Tsung Wang

國家高速網路與計算中心\副研究員
軟體技術組\副組長
國立交通大學電機與控制工程學系\碩士


常戲稱自己的專長是『不學無術』,目前從事雲端運算基礎架構之研發,主要包含Hadoop 雲端運算平台與Xen 虛擬化叢集佈署工具開發。國網中心任職九年,曾參與生態格網(感測網路)、視訊格網(多媒體串流)、捷運內湖線移動式無線管理單元開發(無線網路快速漫 遊)。長期為自由軟體實驗室成員,並致力於整合自由軟體於校園教學環境為目標。2009年因身為企鵝龍與再生龍團隊成員,榮獲行政院科技貢獻獎。未來四年 目標希望持續加強高速運算方面的專長,推動校園聯合雲端運算平台(Class Cloud)在科學研究方面的應用。專長:分散式系統(Distributed System)、感測網路(Sensor Network)