List

To make photos more visually appealing, users usually apply filters on their photos. However, due to the growing number of filter types, choosing a proper filter is cumbersome. To address the issue, we propose a brand-new problem — filter recommendation for photo aesthetics.

To the best of our knowledge, there is no public dataset for aesthetic judgment with filtered images. We create a new dataset called Filter Aesthetic Comparison Dataset (FACD). It contains 28,160 filtered images based on the AVA dataset and 42,240 reliable image pairs with aesthetic annotations using Amazon Mechanical Turk. It is the first dataset containing filtered images and user preference labels. We also proposed neural networks based models augmented with multi-task and aesthetic-ranking-aware learning.

We also appreciate the research supports from MediaTek and MOST.

美的鑑賞,人工智慧也可以嗎?

除了物件辨識、下棋、自動駕駛之外,能不能利用深度學習的方法為生活中帶來「美」的元素?

為了讓消費者能在相片上增加不同的效果或改善影像的品質,許多apps提供濾鏡(filters)功能於使用者使用。以期可以在沒有任何修圖基礎下,輕易地改變圖片的風格。但是隨著濾鏡數量的大幅增加,如何在短時間選擇最好的濾鏡就成為使用上最大的問題。
因此,我們嘗試照片濾鏡美感推薦研究[1]。我們觀察到,絕大部分的使用者,美感的判斷是「相對的」,而不是「絕對的」,因此我們提出全新的卷積神經網路架,配置了相對美感函數,以幫助圖片美學的學習。藉由兩張圖片間的比較結果,提出深度學習模型,能夠將圖片的美學響應學習在設計的「美感隱藏層」中。實驗過程中我們也發現照片的類別(如人像、沙灘、森林等)也會影響到照片濾鏡的選擇,因此設計出的深度學習架構還具備多工學習的能力—同時辨識照片類別以及美感學習—以此提升美學感知能力。

為了訓練並評估新穎的應用,我們建立了第一個濾鏡美感數據集— Filter Aesthetic Comparison Dataset (FACD)。裡面包含將兩萬八千多張套用過濾鏡的圖片,並利用Amazon Mechanical Turk人工標註收集到四萬多個濾鏡圖片相對喜好。
做為國際多媒體研究社區的一員,我們也樂意將此數據集公開,讓全世界研究人員使用比較。
同時我們也感謝 MediaTek 以及 科技部 在產學大聯盟計劃的支持,讓我們團隊可以順利完成資料收集以及採購深度學習運算設備。

[1] Wei-Tse Sun , Ting-Hsuan Chao, Yin-Hsi Kuo, Winston Hsu. Photo Filter Recommendation by Category-Aware Aesthetic Learning.  IEEE Trans. on Multimedia, 2017.

 

  Posts

1 2 3 6
June 7th, 2018

First Place (#1) in Disguised Face Recognition in CVPR 2018

January 6th, 2019

意想不到的科技部「AI投資潛力獎第一名」

December 16th, 2018

Keep Recruiting for Machine Learning Research Partners for Numerous Visual Sensors

December 16th, 2018

FutureTech Demo and Breakthrough Award (未來科技突破獎)

October 12th, 2018

結合虛與實的試鞋生成網路 (Virtual Try-On Shoe with Generative Neural Networks)

我們都有這樣的困擾,在電子購物的時候,看到一雙好看的鞋子,想買。但是卻又拿不定主意自己穿起來好看嗎?或是搭配某件褲子適合嗎?怎麼讓網路虛擬商城的鞋子,可以有效試在自己的腳上呢? 這個工作的挑戰在於如何使用單張鞋子商品的照片,很自然的合成在使用者的腳上,而且腳可能會有各種姿勢、角度。如何客服這個問題? 很高興大學部專題生(EE) 周晁德 完成了這個 PIVTONS 的虛擬鞋子試穿生成網路,試著解決這個困擾大家很久的問題。 這個有趣的工作也將於十二月初,在澳洲珀斯舉辦 Asian Conference on Computer Vision (ACCV) 2018 以大會演說 (Oral) 的方式跟大家分享這個工作。接下來全新的測試資料集將會公開讓大家使用,如果可以的話,我們也將試試看將整個試穿生成系統上線,讓大家體驗虛擬試鞋的樂趣 — 可以多試穿,多省錢。 我們鼓勵high-risk的研究工作。令人慶幸的是,這工作的發想、資料收集都是專題生獨立完成。當然在過程當中遇到很多GAN生成的問題,網路設計、訓練的問題,幾乎放棄了,還好團隊成員一起想辦法解決,關關難過,關關過(甚至免費擔任model),讓這個兼具技術深度以及商業價值的系統,可以順利完成。 我們也一直努力,讓智能生成(或是辨識)系統,賦予更有意義的應用 […]

September 13th, 2018

Finalist (Top 3) in 2018 IEEE Signal Processing Society Video and Image Processing (VIP) Cup

July 29th, 2018

信手拈來的3D模型搜尋 (Cross-View and Cross-Domain 3D Model Search)

July 27th, 2018

低解析人臉辨識跟解析度放大 (Very Low-Resolution Face Hallucination and Recognition)

June 18th, 2018

Winning Third Place in CVPR 2018 Video Recognition Challenge — Moments in Time

June 13th, 2018

[Video Report] National Investment for the GPU Supercomputer?

June 9th, 2018

Amazing Crowd Size and Positive Feedbacks in the Deep Learning Lecture for GTC 2018 Taipei