List

在機器智能的運用上,困難的問題,一般會利用(1)採用更複雜的模型(如數十層的類神經網路),或是(2)提供更多標註過的訓練資料。但是資料標註的代價(所需準備的時間以及金錢)是相當昂貴的。尤其時間是產業應用上,時間是相當貴重的成本。

另一個想法:如果可以善用Internet上隨手可得的資料,有時候複雜困難的問題,會有意想不到的突破!

之前我們嘗試解決人臉辨識上一個未解的問題—「跨年紀人臉辨識」。如果使用face verification的定義的話, 我們得決定任兩張(相距五到十年)的照片,是否屬於同一人。

大家可以參考看看這張照片,猜測一下,屬於同一個人嗎?

跨年紀人臉辨識,在兩年前還是十分困難的問題。過去以來,大家考慮的是尋找逼近老化的方程式,或是找出不受年齡影響 (age-invariant)的人臉特徵表示方法。可是人類老化是個複雜的model,所以一直無法突破。

我們 (Sirius Chen 以及 Dr. Chu-Song Chen) 則大膽採用了另一個全新的策略。我們以網路上隨手可得的名人照片來表示(解釋)人像;比如說某個人鼻子長得像明星A、嘴巴像明星B、下巴像明星C,等(約數百位名人)。如此一來,沒有例外,大家都會經過類似的老化過程。因此這個人和名人A、B、C等在某個部位還是維持相似性。我們就用這樣的表示法來代表人臉特徵值(過程使用sparse coding、 high-dimensional LBP、max pooling實現)。

有趣的是這些名人照片數量之多,資料之詳盡(出生年、年紀、性別等),遠超過我們當初的想像。為了支持我們的實驗,我們收集到最大的跨年齡人臉辨識資料庫,2000位世界名人,橫跨約10年,超過十六萬張照片。我們也將這第一個跨年齡的人臉辨識資料,公開讓研究社區使用,稱為 Cross-Age Celebrity Dataset (CACD)跨年齡名人資料庫。

很驚訝的,效果遠超過當時的所有方法。我們也發現這個 Data-Driven的跨年齡人臉辨識方法,在2015年就已經超越一般人的極限。我們在Amazon MTurk (付費)收集到四萬人次如照片中的辨識實驗。經過統計,人類的平均跨年齡辨識率為85.7%。而我們提出的「以資料制資料」的方法,正確率為87.6%。

顯然地,合理、robust的演算法,在足夠(並兼具多樣性、正確性等)的資料下,可以大大的勝出。這也隱含如果針對某些應用領域,以合理的成本善用資料,對於許多看似艱難的問題,都可以有另人驚豔的突破!

  Posts

1 2 3 6
June 7th, 2018

First Place (#1) in Disguised Face Recognition in CVPR 2018

January 6th, 2019

意想不到的科技部「AI投資潛力獎第一名」

December 16th, 2018

Keep Recruiting for Machine Learning Research Partners for Numerous Visual Sensors

December 16th, 2018

FutureTech Demo and Breakthrough Award (未來科技突破獎)

October 12th, 2018

結合虛與實的試鞋生成網路 (Virtual Try-On Shoe with Generative Neural Networks)

我們都有這樣的困擾,在電子購物的時候,看到一雙好看的鞋子,想買。但是卻又拿不定主意自己穿起來好看嗎?或是搭配某件褲子適合嗎?怎麼讓網路虛擬商城的鞋子,可以有效試在自己的腳上呢? 這個工作的挑戰在於如何使用單張鞋子商品的照片,很自然的合成在使用者的腳上,而且腳可能會有各種姿勢、角度。如何客服這個問題? 很高興大學部專題生(EE) 周晁德 完成了這個 PIVTONS 的虛擬鞋子試穿生成網路,試著解決這個困擾大家很久的問題。 這個有趣的工作也將於十二月初,在澳洲珀斯舉辦 Asian Conference on Computer Vision (ACCV) 2018 以大會演說 (Oral) 的方式跟大家分享這個工作。接下來全新的測試資料集將會公開讓大家使用,如果可以的話,我們也將試試看將整個試穿生成系統上線,讓大家體驗虛擬試鞋的樂趣 — 可以多試穿,多省錢。 我們鼓勵high-risk的研究工作。令人慶幸的是,這工作的發想、資料收集都是專題生獨立完成。當然在過程當中遇到很多GAN生成的問題,網路設計、訓練的問題,幾乎放棄了,還好團隊成員一起想辦法解決,關關難過,關關過(甚至免費擔任model),讓這個兼具技術深度以及商業價值的系統,可以順利完成。 我們也一直努力,讓智能生成(或是辨識)系統,賦予更有意義的應用 […]

September 13th, 2018

Finalist (Top 3) in 2018 IEEE Signal Processing Society Video and Image Processing (VIP) Cup

July 29th, 2018

信手拈來的3D模型搜尋 (Cross-View and Cross-Domain 3D Model Search)

July 27th, 2018

低解析人臉辨識跟解析度放大 (Very Low-Resolution Face Hallucination and Recognition)

June 18th, 2018

Winning Third Place in CVPR 2018 Video Recognition Challenge — Moments in Time

June 13th, 2018

[Video Report] National Investment for the GPU Supercomputer?

June 9th, 2018

Amazing Crowd Size and Positive Feedbacks in the Deep Learning Lecture for GTC 2018 Taipei