Page 118 - My FlipBook
P. 118


實驗

資料探勘與機器學習實驗室

Research Laboratories 研究人員 在此資料爆炸的時代,各類型的資料 ( 如:感測器、軌跡、交易、多媒體、社群網路、網
頁瀏覽紀錄等 ) 正以越來越快的速度產生。隨著硬體與網路豐富及低成本的特性,探究所
楊得年 / 召集人 有運用這些資料的方法以增進現有應用,或是探討新技術解決難題的時機從未比現在更
佳。資料探勘與機器學習實驗室組成的主要目標,就是開啟創新研究,並發展下列卓越之
研究員 技術:(1) 有效收集、表示、儲存、處理與分析巨量資料;(2) 探究資料探勘技術以快速且
有效地發現各式各樣資料中有價值的知識。目前本團隊的研究聚焦於下列領域:一、機器
張原豪 學習於網路廣告即時競價;二、社群網路分析與查詢處理;三、寫入受限記憶體與儲存裝
置之高效資料管理系統;四、複合式類神經網路:理論與 PM2.5 預測的應用。在這些研究
研究員 領域中,我們正進行下列研究:

陳孟彰

研究員

葉彌妍

研究員

廖弘源

特聘研究員

一、機器學習於網路廣告即時競價

網路展示型廣告已由過去固定內容固定價位的銷售方式,演變成為現在根據不同瀏覽
人次由競價結果動態決定內容:在使用者造訪網址且網頁完整呈現的短時間內,有興
趣的廣告主們透過程式化交易競標爭取廣告曝光。在即時競價交易環境中,廣告主要
能快速且精準地跨媒體購買廣告,必需仰賴好的預測模型自動出價。本實驗室目標協
助廣告主在有限且不完整的歷史競價資料中,設計出合適的機器學習方法,以建立有
效的預測模型來精準地預測廣告點擊率,進而能在有限的廣告成本下決定適切的出價
策略。

二、社群網路分析與查詢處理

在新興的平台(如:Facebook Live 與 Twitch)中,直播串流的普及已促使新的影片內
容與社群團體的急速增長,除了讓使用者得以即時開設各種主題(如:新聞、運動與
競賽)的串流頻道外,直播中最重要的兩項特徵有 (1) 多重串流:觀眾可同時觀看活
動實況的多個串流與 (2) 即時的社群互動:觀眾可彼此聊天互動,也可和直播主聊天,
或贈送虛擬禮物。然而,現有選擇直播頻道的方法仍聚焦於滿足使用者個人喜好,並
未考慮供應觀眾間的即時社群互動以及提供多樣化的直播頻道內容。故我們設計一
套「社群感知多樣化喜好直播頻道查詢(SDSQ)」,其同時選出一組多樣化且受歡迎
的直播頻道及一群彼此間社群關係緊密的觀眾。我們證明 SDSQ 為 NP-hard,且在任意
比例內不可近似,並設計一套 2 倍近似演算法 SDSSel,可保證其誤差上限。在 Twitch
上的使用者個案研究驗證了 SDSQ 的必要性及 SDSSel 的實用性。社群網路的普及度急
遽上升卻造成了不當使用,日益增加的社群網路精神障礙(如:網路關係成癮、資訊
過量負荷與強迫上網行為等)已在近期受到關注。這些精神障礙的症狀通常是被動地
被發現的,這使得臨床介入治療的時機常被延誤,因此,探勘線上網路行為可提供及
早並主動探測到社群網路精神障礙的機會。而探測社群網路精神障礙是具挑戰性的,
因為從線上社群活動記錄並無法直接觀察到使用者的心理狀態。我們提出一套機器學
習的框架──社群網路精神障礙探測(SNMDD)以及新的張量模型(STM),以協助
心理治療專家及早減緩社群網站成癮患者的症狀。我們提出一套動態貼文抽換與輔助
系統(N3S)的新框架,以動態貼文過濾及傳遞的方式作為社群網站成癮治療的輔助,
其包括成癮程度模型(ADM)以測量動態貼文對不同使用者的成癮程度,以及一個新
的最佳化問題,以在不犧牲使用者喜好的情況下,將行為治療的效果最大化。我們亦

116
   113   114   115   116   117   118   119   120   121   122   123