Page 20 - 2017 Brochure
P. 20
究群

資料處理與探勘實驗室

在資料爆炸的時代裡,各種資料,例如感應器資料、軌跡 SNMD) 之目的。我們提出了一個機器學習作法-社群網路
資料、交易資料、多媒體資料,以飛快的速度時時刻刻產 心理疾病偵測 (Social Network Mental Disorder Detection,
生。目前硬體與網路高質與量,價錢相對便宜,是最佳時 SNMDD) 以及基於社群網路心理疾病的張量模型(Tensor
刻來發展相關研究議題,來善用這些資料來來改進現有服 Model),以精確地偵測出可能發生社群網路心理疾病的
務,或用來解決目前無法解決的問題。所以本研究小組的 情況,且其實驗結果表明了社群網路心理疾病偵測對於辨
主要目標在於起始相關創新研究以達科學與技術的卓越性。 認 出 可 能 患 有 社 群 網 路 心 理 疾 病 的 使 用 者 相 當 有 效。 關
目前我們著重於以下研究領域 (1) 有效收集、表現、儲存、 於群體治療,我們提出一個線上互助群體成員 (Member
與處理大量各式資料,(2) 探討資料探勘技術來有效率、有 Selection for Online Support Group,MSSG) 選擇問題,在
效益來發現有價值的知識。目前我們研究的議題包括 (1) 社 確保群體中任意兩位成員間並不熟識的狀況下,將所有成
群網路分析與查詢處理,(2) 機器學習於網路廣告即時競價, 員的症狀的相似度最大化。我們證明 MSSG 是個 NP-Hard
(3) 深度學習於都會區空汙預測,(4) 非揮發性主記憶體之索 的問題,且在任意比例內不可近似,故設計了可保證誤差
引設計與資料探勘。各計畫簡述於下: 之 3 倍近似演算法。

(1) 社群網路分析與查詢處理 (2) 機器學習於網路廣告即時競價

社群網路方面的研究貢獻集中於高效率的社群群體查詢以 網路展示型廣告已由過去固定內容固定價位的銷售方式,
及社群影響力。關於地理位置社群網路 (Location-based 演變成為現在根據不同瀏覽人次由競價結果動態決定內容:
Social Networks),我們提出了新的索引結構並提出社群空 在使用者造訪網址且網頁完整呈現的短時間內,有興趣的
間群體查詢 (Social-Spatial Group Query),以快速找出距離 廣告主們透過程式化交易競標爭取廣告曝光。在即時競價
近且社群關係緊密之社交群體,並求得適當位置給予所得 交易環境中,廣告主要能快速且精準地跨媒體購買廣告,
之群體。除了考慮時間及空間外,我們亦考慮使用者之偏 必需仰賴好的預測模型自動出價。本實驗室目標協助廣告
好群體搜尋,並設計具效能保證之隨機演算法,其可運用 主在有限且不完整的歷史競價資料中,設計出合適的機器
於線上至線下的社群應用或是團購優惠服務。對於職業社 學習方法,以建立有效的預測模型來精準地預測廣告點擊
群網路,我們提出了新的社群空間查詢,為了形成專業工 率,進而能在有限的廣告成本下決定適切的出價策略。
作團隊,在進行查詢時考慮到群組距離、群組成員的專業
技能以及群組中社群關係。我們證明了此問題在任意比例 (3) 深度學習於都會區空汙預測
內的不可近似性,但在允許可接受誤差的狀況下,我們設
計了一個保證錯誤誤差之近似演算法。此外,考慮到社群 都會區空氣汙染預測與汙染源偵測是一個待解的急迫問題,
心理學中的社會臨場感理論 (Social Presence Theory),我 嚴重影響到環境、健康、經濟,以及公共利益。近三年來
們提出一個新的有效認識新人群之社群群體查詢問題,並 已有很多研究使用各種方法,包括類神經網路、機器學習
設計了一個 3 倍近似演算法。

此外,針對特定對象的影響力傳播,我們提出一個新的最
佳中介節點選擇問題,以改變特定對象之決定,而我們也
提出行動社群網路中的分散式作法。我們亦結合了頻繁樣
式探勘 (Frequent Pattern Mining),提出與多個相關商品組
合銷售之病毒式行銷影響力傳播最佳化問題。我們提出以
超 圖 (Hypergraph) 與 超 邊 (Hyperedges) 為 基 礎 以 頻 繁 樣
式之社群物件圖 (Social Item Graph),提出了一個近似演算
法,並基於 FP-Tree 設計了一個新索引結構。另一方面,
我們觀察到資料探勘線上社群行為,可有效達成早期自動
辨認社群網路心理疾病 (Social Network Mental Disorder,

18 研究群 Research Laboratories
   15   16   17   18   19   20   21   22   23   24   25