陳昇瑋
[English version | Chinese version]


陳昇瑋 ﹝原名 陳寬達﹞ 
中央研究院 資訊科學研究所 研究員 | 資料洞察實驗室 主持人
台灣資料科學協會 理事長 | 台灣資料科學年會 發起人暨總召集人

   

▂▅ 演講簡報 〈資料科學往前看-從大數據到人工智慧〉 ▅▂

▂▅ 招生啟事:香港科技大學電機及資訊工程系招收博士生 ▅▂
▂▅ 徵才啟事:博士後研究員 | 研究助理 | 軟體工程師 ▅▂

新的資訊

有人這麼說

有人訪問 H.J. Eysenck (一位知名的心理學家):「當某個研究帶來令您滿意的成果時,您的感覺如何?」

他的回答是:「那種感覺就好像貓得到奶油一樣,很難加以形容。我想那是一種充盈的美好感覺,你覺得一切都是那麼地令人愉快。我個人對自己原先預測的某些東西終於成為事實,多少會感到驚訝,因為我總覺得那不太可能,但現在卻成為事實,實在值得慶祝。所以你會對自己感到高興,對自然、對整個世界感到高興,你覺得生命真美好,值得繼續活下去。」

你也想一起來體會「貓得到奶油」的感覺嗎?:-)

貓得到奶油

我是誰

陳昇瑋博士目前為中央研究院資訊科學研究所以及資訊科技創新研究中心研究員資料洞察實驗室主持人,同時是台灣資料科學協會理事長。他的研究焦點著重在使用者滿意度、多媒體及社群系統及計算社會學等,在使用者/社群意見及感受的淬取及量化方面持續有代表性的研究創見。

陳博士堅信資料及資料分析的價值,長期推廣資料科學及其在各領域的應用,發起台灣資料科學協會台灣資料科學年會,期能將對於資料科學的熱情傳達給大眾,一起來探索資料科學的潛力,並將資料科學引入每個人的專業領域之中。他期待讓資料分析在台灣不再是口號,而是大家真實拿來解決問題及創造價值的工具。

陳昇瑋於國立臺灣大學電機工程學系取得博士學位 (2006),於國立清華大學資訊工程學系取得碩士 (2000) 及學士 (1998) 學位。他於 2008 年榮獲 IWSEC 2008 最佳論文獎,於 2009 年榮獲 ACM 台北/台灣分會李國鼎青年研究獎,於 2010 年榮獲中國電機工程學會優秀青年電機工程師獎,2013 年榮獲傑出人才基金會年輕學者創新獎,並於 2014 年榮獲 IEEE ComSoc MMTC Best Journal Paper Award。進入學術界之前,他以陳寬達之名在技術領域闖蕩,曾是 Windows 及系統程式設計師、業界程式設計課程講師技術書籍及雜誌專欄作者共享軟體作者BBS 開發者/站長

個人觀點

雜誌訪談

榮譽

研究領域 (研究概述)

學術著作

學術演講 (完整列表)

大數據在台灣蔚為風潮,無論是政府官員或販夫走卒,人人皆聽聞大數據的威力。因此,產業界及各級政府皆努力建置所謂的大數據平台,以蒐羅及保存資料為己任,並導入資料的視覺分析工具,讓決策者們能夠快速地查看管理或施政成效,以客觀數據來輔助主觀評價,以分析輔助經驗,以事實取代臆測。

這些都是好的進展。收集資料並整理成視覺化的分析圖表,對於評估及掌控現況有非常大的幫助,讓我們不再只能依直覺及經驗做決策。但,其實,這只是把資料平台準備好而已,要充份發揮資料的價值,還沒有沾到邊。

要發揮資料價值,不能光談大數據,機器學習與人工智慧是絕對不該忽略的。事實上,這三者環環相扣:大數據是材料,機器學習是處理方法,人工智慧是成品所呈現的特質。這個時代,蒐集了大量資料,只呈現給人看,而不是拿來餵給電腦學習,讓你的應用呈現人工智慧,就跟採集了大量松露結果拿來沾醬油一整碗吃掉一樣可惜。如同精靈寶可夢需要有訓練師才能發揮能力,擁有大數據後,我們也需要很多很多的機器學習專家(有人稱呼為AI訓練師),才能讓我們手中的大數據真正發揮價值。

在此演講中,我將為聽眾闡明資料科學、大數據、人工智慧、機器(深度)學習、資料探勘等相近但又不同的詞彙,再以各領域的實際案例來分享資料的可能應用及實用價值。同時,我將與聽眾分享其協助多家企業培訓資料科學家及導入資料科學團隊的各種經驗,從企業如何跳脫既有框架,讓資料科學團隊盡情揮灑無限創意著手,進而能活用資料、挖掘出潛藏在資料中不為人知的秘密,最終打造高信任度及高效率的工作環境,展現資料分析的價值。

社會科學研究十分困難,主要可能有數個原因,包含 1) 社會行為本身的複雜性; 2) 取得觀測數據的困難性; 以及 3) 在大型社會組織中難以進行實驗,因此,相對於物理學、工程學、生物科學而言,社會科學研究的進展尤其緩慢。但在過去二十年來的資訊革命中,不僅電腦本身的計算速度和儲存容量急遽增加,且取得及分析社會行為觀察數據的範圍及規模也隨之提昇,以現今的電腦計算分析能力,極有可能劇烈改變傳統的社會科學研究方法。

社會現象可以計算嗎?2009 年二月,以哈佛大學教授大衛·拉澤爾為首的十五位來自美國不同學科的大學教授聯名在〈科學〉雜誌上發表了題為「計算社會科學」 (Computational Social Science) 的論文,帶起一個新興研究領域的誕生。簡單地說,計算社會科學是一個匯集社會科學和計算科學的新興領域,它的出現是因為新型態的數據來源,不斷提高的計算能力以及與電腦及統計科學家的關注以及與社會科學家的共同合作,其主要研究方法包含巨量數據觀測、群眾外包實驗、電腦模擬實驗、及演算模型等等。結合電腦科學的計算思維及社會科學長久發展的理論,預期將深刻改變研究者們如何觀察、瞭解及改善這個社會。

在此演講中,陳昇瑋博士將簡介計算社會科學這門新興的研究領域,並以自身的研究主題出發,分享如何使用網路實驗、資料分析及統計模式,來瞭解及帶動計算社會科學研究,以及如何通過大數據的收集、分析及建模,來觀察及解決我們切身的社會現象及問題。

網路安全是一個特殊的研究領域,其中一個原因是在網路安全問題中,"對手"不是文字、影像或任何形式死板板的資料,而是活生生的人;這些製造問題的黑客 (black hat hackers) 終日找尋各種系統及網路漏洞,企圖提出更高明的攻擊方式來獲取各種可能的利益。因此,在網路安全研究中,我們無法"預設"黑客會有什麼樣的攻擊行為,而必須從真正的資料中尋找蛛絲馬跡,從大量資料中發現及解決各種已發生或將發生可能危害使用者資料安全及隱私的行為。在這場研究中,我將介紹 data-driven network security research 並以幾個實際的研究案例來展示真實資料的統計分析可以幫助我們解決什麼樣的安全問題。
Games on demand, a.k.a., cloud gaming, refers to a new way to deliver computer games to users, where computationally complex games are executed and rendered on powerful cloud servers rather than local computing devices. In this talk, I will give an overview of the challenges in developing cloud gaming systems, what we have done, and what remains to do. I will start from GamingAnywhere, an open-source cloud gaming system, followed by a number of studies based on the system. Finally I will conclude the talk with open issues in providing highly real-time and high-definition audio/visual quality multimedia experience (e.g., in the form of gaming and virtual reality).

線上遊戲已被證明是網際網路的殺手級應用之一,許許多多的遊戲公司相繼投入萬人線上遊戲的研發行列。同時,電腦網路、人工智慧、多媒體、心理學、社會學等領域的學術研究者,也相繼在線上遊戲中發現值得關注的研究議題。從心理學家的角度,研究線上遊戲玩家的成癮行為,以及從現實社會的抽離是個重點的議題;從社會學家的角度,線上遊戲社群就像一個社會的縮影,透過觀察遊戲中玩家之間的人際關係及互動,可以做為驗證社會學理論的實驗場。當然,從電腦系統及網路研究者的角度來看,萬人線上遊戲本身就是一個極複雜的大型電腦通訊系統,值得投身其中為提供使用者更佳的服務品質而努力。

在這場演講中,我將從自身投入線上遊戲研究的五個理由開始,介紹線上遊戲研究的五個領域,包括電腦網路、安全及隱私、使用者行為、系統架構及人機互動。介紹的重點主題包括:

1) 遊戲外掛的偵測技術
2) 遊戲玩家的忠誠度分析
3) 網路品質對於遊戲玩家的行為影響
4) 雲端運算與線上遊戲
5) 自動遊戲漫畫製作技術

透過短短一個半小時的分享,希望你也能和我一樣領略在線上遊戲研究所帶來的無比樂趣。

國小四年級寫出第一支程式,爾後一頭栽入程式設計,至碩士畢業前經歷各式角色,從業界程式設計課程講師、技術書籍及雜誌專欄作者、共享軟體作者至 BBS 開發者/站長等,陳昇瑋原以為自己註定是一輩子的程式人;不料幾年前的一個決定,闖入了學術圈,成為一個以研究為己志,啃寫論文過活的學術人。雖然如此,在他深處的那份程式人的魂,不曾離去。

在這場演講中,陳博士將會介紹他在中央研究院進行的一系列與線上遊戲、網路安全、使用者隱私有關的研究成果。從遊戲的外掛偵測開始,他將簡述各式有趣、富挑戰性及實用性的研究,包括遊戲玩家的忠誠度分析、電腦輔助漫畫創作,Web 2.0 時代的資訊洩露危機,以及如何即時偵測僵屍電腦等。透過這場短短的分享,他希望讓大家知道程式人是何等幸福的族類,只要擁有好奇心、熱情及足夠的技術實力,在哪兒都可以把工作變得好玩,並有機會對社會做出正面的貢獻。

社群網路網站是 Web 2.0 世代裡十分重要的服務之一。在這類型的網站上,人們可以認識新朋友,互相交流,或與現實世界中的朋友們保持連繫及互動;透過網際網路的通訊能力,連接處於不同位置的人們。然而,當人們的互動從面對面的形式轉變成在網路上進行,許許多多的個人資訊及行為不知不覺中累積、甚至曝露在網路空間中。人們在欣喜互動的過程中,通常忘了自己的隱私資訊正一點一滴地洩露給網路上不知名的窺探者。

在這場演講中,我將從網路資料的不可抹滅性開始,探討在社群網路服路中常見的資訊洩露方式,以及哪一種系統/設計/使用習慣容易造成這些資訊洩露情形,這包含使用者主動的自我資訊洩露以及不是由使用者本身造成的二手資訊洩露。同時,我也將介紹由於社群網路服務流行為後而興起的網路資安隱憂,並在以可能的解決方案來做結。透過這場短短的分享,以傾聽的姿勢,希望見到大眾對於 Web 2.0 資安隱憂的正視與迴響。

在電腦系統的設計中,使用者經驗 (Quality of Experience) 已成為一項極重要的系統良窳設計指標。對於必須呈現在使用者面前的電腦系統,不論其系統層面效能指標多好,若使用者覺得不愉快,就不能算是好的設計。然而使用者滿意度是抽象的感覺,無法直接觀察或量測得到,因此,如何讓電腦系統在任何情況下都能提供讓人滿意的使用經驗是一個懸而未解的開放問題。要達到此目標必須解決三個子問題,分別是 1) 如何有系統有效率地量測使用者滿意度, 2) 如何描述 (模型化) 使用者滿意度與系統層面效能指標的關係, 3) 如何自動調校系統參數來達成最佳使用者滿意度。

在這場演講中,我將分別依序三個子問題。從如何減輕受試者實驗進行的困難度及檢驗實驗結果可靠度開始,讓研究者可以透過網際網路邀請廣大的網路用戶們來協助進行實驗;進而將使用者滿意度指標與諸多系統效能指標(例如延遲時間、系統處理時間、頻寬等等)以模型來描述,最終探討如何自動調校系統參數來達成最佳使用者滿意度。使用者經驗近年來已逐漸受到網路及多媒體領域研究者的重視,雖然它抽象它難以量測,但若我們在電腦系統設計中持續地將它當成一等公民來考量,相信未來的網路及多媒體系統能提供更佳的使用者經驗,在各種環境中。

近年來殭屍網路的操作者廣泛地運用匿蹤技術(fast-flux)延長惡意資源的生命週期,以避免殭屍網路所產生的惡意活動遭到研究人員一次性全面移除。一個匿蹤殭屍網路所使用的網域名稱,會隨著時間對應到大量的IP位址,當客戶端對於這些IP位址送出資源請求時,實際上<在處理資源請求的伺服器並非客戶端所見的主機,而是隱藏在幕後的惡意伺服器。目前國際間所提出的匿蹤殭屍網路偵測機制大多依賴匿蹤殭屍網路使用的網域名稱會大量變換IP位址的特徵,雖然此一特徵能夠有效並且正確地偵測匿蹤殭屍網路,然而此類偵測系統勢必需要一段觀察時間來決定偵測對象是否為匿蹤殭屍網路。

在本演講中,我將介紹我們對於利用匿蹤技術提供網頁服務的殭屍網路提出一嶄新的匿蹤殭屍網路即時偵測機制。本偵測機制基於匿蹤殭屍網路的天生特性及其所造成之現象,選定用來偵測殭屍電腦的特徵,其特性包含:1)殭屍網路的資源請求委外運作模式、2)殭屍電腦的資源並非完全用以提供惡意服務,以及 3)殭屍電腦的硬體設定明顯不如專業伺服器。實際效能評估顯示本偵測機制於被動偵測模式中運行時,能夠在數秒內偵測出匿蹤殭屍電腦,並且達到至少 96% 的偵測準確率及小於 5% 的誤判率。

學術資源

關於學術研究

技術著作

技術演講

技術創作

技術資源

其他

連絡資訊

電子郵件: swc@iis.sinica.edu.twktchen@iis.sinica.edu.tw
電話: 02-27883799 分機 1712
傳真: 02-27824814
辦公室: 資訊所新館712
郵寄地址: 115 台北市南港區研究院路二段128號 中央研究院資訊科學研究所


陳昇瑋(原名:陳寬達)
http://www.iis.sinica.edu.tw/~swc 
Last Update February 01, 2017