Page 32 - My FlipBook
P. 32
人
智慧
計
畫 深度學習與新興電腦視覺應用
Arti cial Intelligence Projects 計畫主持人:劉庭祿博士
計畫期程:2018/1~2021/12
本計畫為四年期的研究規劃,旨在發展深度學習技術與 自然語言技術等,提出新興電腦視覺研究議題與應用。
其在電腦視覺領域的最新應用。關於深度學習方面,本 我們亦將探討適用於 360 影像、點雲集與醫學影像的電
計畫將聚焦於發展深度學習的各項核心技術,包含從基 腦視覺演算法。此外,本計畫與業界合作方面將著重於
礎的訓練資料正規化到深度學習網路架構的自動化搜尋 智慧零售與智慧製造,特別是發展考量邊緣設備運算資
源之深度學習網路精簡化技術,搭配快速的物件偵測與
等研究議題。針對監督式、半監督式、弱監督式與少例 辨識方法,來開發可自動化處理日常零售商品銷售的相
訓練資料的各種深度學習模式,亦是本計畫的重點研究 關商業應用。以下簡述本計畫前兩年執行之主要研究成
項目。在電腦視覺應用方面,我們將立基於本實驗室過 果與業界合作現狀。
去在物件偵測、物件辨識與影像分割等研究成果,開發
以深度學習為骨幹的新世代電腦視覺技術,並結合諸如
類生成對抗網路之電腦視覺技術
有鑑於生成對抗網路(GAN)與相關深度學習模型的優異 網路之非監督式學習機制,該機制無須透過明確的像素
表現, 在訓練深度學習網路(DNN)時若能善用類似生 層級前後景區域標註,即可自動建模出泛化的影像前後
成對抗網路(GAN)的信息反饋方式,應亦可獲致令人印 景概念。更為具體地說,我們的方法將元學習過程轉化
象深刻的神經網路效能提升。受此信息反饋方式的啟發, 為一種組合圖像編輯任務,藉由取得網路上豐富的視覺
我們著手研究用於訓練深度學習網路時的各式有效信息 效果圖像資料,該非監督式學習機制可訓練所設計之深
度學習網路來模仿某種視覺效果,於模型訓練時獲得的
反饋方式(例如網路聚合、注意力導引、記憶提示、局 相對應內部表示遮罩除可用來完成組合圖像編輯任務,
部或全域資訊、多模態融合等其他方式)。對於物件偵測 也可用來描述前景(請參見圖一)。這項研究成果發表在
問題,我們設計以非局部重點區域(ROI)配合邊框式相 AAAI 2019 上,而所設計的非監督式學習機制現已廣泛用
關性,來擴增物件偵測之特徵表示。該技術在 CVPR 2018 於解決實際應用。
中取得了強健性視覺挑戰賽中的實例分割競賽第一名。
針對處理影像分割問題,我們設計一種植基於生成對抗
圖一: Visual-E ect GAN (VEGAN) for gure-ground segmentation.
30
智慧
計
畫 深度學習與新興電腦視覺應用
Arti cial Intelligence Projects 計畫主持人:劉庭祿博士
計畫期程:2018/1~2021/12
本計畫為四年期的研究規劃,旨在發展深度學習技術與 自然語言技術等,提出新興電腦視覺研究議題與應用。
其在電腦視覺領域的最新應用。關於深度學習方面,本 我們亦將探討適用於 360 影像、點雲集與醫學影像的電
計畫將聚焦於發展深度學習的各項核心技術,包含從基 腦視覺演算法。此外,本計畫與業界合作方面將著重於
礎的訓練資料正規化到深度學習網路架構的自動化搜尋 智慧零售與智慧製造,特別是發展考量邊緣設備運算資
源之深度學習網路精簡化技術,搭配快速的物件偵測與
等研究議題。針對監督式、半監督式、弱監督式與少例 辨識方法,來開發可自動化處理日常零售商品銷售的相
訓練資料的各種深度學習模式,亦是本計畫的重點研究 關商業應用。以下簡述本計畫前兩年執行之主要研究成
項目。在電腦視覺應用方面,我們將立基於本實驗室過 果與業界合作現狀。
去在物件偵測、物件辨識與影像分割等研究成果,開發
以深度學習為骨幹的新世代電腦視覺技術,並結合諸如
類生成對抗網路之電腦視覺技術
有鑑於生成對抗網路(GAN)與相關深度學習模型的優異 網路之非監督式學習機制,該機制無須透過明確的像素
表現, 在訓練深度學習網路(DNN)時若能善用類似生 層級前後景區域標註,即可自動建模出泛化的影像前後
成對抗網路(GAN)的信息反饋方式,應亦可獲致令人印 景概念。更為具體地說,我們的方法將元學習過程轉化
象深刻的神經網路效能提升。受此信息反饋方式的啟發, 為一種組合圖像編輯任務,藉由取得網路上豐富的視覺
我們著手研究用於訓練深度學習網路時的各式有效信息 效果圖像資料,該非監督式學習機制可訓練所設計之深
度學習網路來模仿某種視覺效果,於模型訓練時獲得的
反饋方式(例如網路聚合、注意力導引、記憶提示、局 相對應內部表示遮罩除可用來完成組合圖像編輯任務,
部或全域資訊、多模態融合等其他方式)。對於物件偵測 也可用來描述前景(請參見圖一)。這項研究成果發表在
問題,我們設計以非局部重點區域(ROI)配合邊框式相 AAAI 2019 上,而所設計的非監督式學習機制現已廣泛用
關性,來擴增物件偵測之特徵表示。該技術在 CVPR 2018 於解決實際應用。
中取得了強健性視覺挑戰賽中的實例分割競賽第一名。
針對處理影像分割問題,我們設計一種植基於生成對抗
圖一: Visual-E ect GAN (VEGAN) for gure-ground segmentation.
30