在機器智能的運用上,困難的問題,一般會利用(1)採用更複雜的模型(如數十層的類神經網路),或是(2)提供更多標註過的訓練資料。但是資料標註的代價(所需準備的時間以及金錢)是相當昂貴的。尤其時間是產業應用上,時間是相當貴重的成本。
另一個想法:如果可以善用Internet上隨手可得的資料,有時候複雜困難的問題,會有意想不到的突破!
之前我們嘗試解決人臉辨識上一個未解的問題—「跨年紀人臉辨識」。如果使用face verification的定義的話, 我們得決定任兩張(相距五到十年)的照片,是否屬於同一人。
大家可以參考看看這張照片,猜測一下,屬於同一個人嗎?
跨年紀人臉辨識,在兩年前還是十分困難的問題。過去以來,大家考慮的是尋找逼近老化的方程式,或是找出不受年齡影響 (age-invariant)的人臉特徵表示方法。可是人類老化是個複雜的model,所以一直無法突破。
我們 (Sirius Chen 以及 Dr. Chu-Song Chen) 則大膽採用了另一個全新的策略。我們以網路上隨手可得的名人照片來表示(解釋)人像;比如說某個人鼻子長得像明星A、嘴巴像明星B、下巴像明星C,等(約數百位名人)。如此一來,沒有例外,大家都會經過類似的老化過程。因此這個人和名人A、B、C等在某個部位還是維持相似性。我們就用這樣的表示法來代表人臉特徵值(過程使用sparse coding、 high-dimensional LBP、max pooling實現)。
有趣的是這些名人照片數量之多,資料之詳盡(出生年、年紀、性別等),遠超過我們當初的想像。為了支持我們的實驗,我們收集到最大的跨年齡人臉辨識資料庫,2000位世界名人,橫跨約10年,超過十六萬張照片。我們也將這第一個跨年齡的人臉辨識資料,公開讓研究社區使用,稱為 Cross-Age Celebrity Dataset (CACD)跨年齡名人資料庫。
很驚訝的,效果遠超過當時的所有方法。我們也發現這個 Data-Driven的跨年齡人臉辨識方法,在2015年就已經超越一般人的極限。我們在Amazon MTurk (付費)收集到四萬人次如照片中的辨識實驗。經過統計,人類的平均跨年齡辨識率為85.7%。而我們提出的「以資料制資料」的方法,正確率為87.6%。
顯然地,合理、robust的演算法,在足夠(並兼具多樣性、正確性等)的資料下,可以大大的勝出。這也隱含如果針對某些應用領域,以合理的成本善用資料,對於許多看似艱難的問題,都可以有另人驚豔的突破!
- Chen, Bor-Chun, Chu-Song Chen, and Winston H. Hsu. “Face recognition and retrieval using cross-age reference coding with cross-age celebrity dataset.” IEEE Transactions on Multimedia 17.6 (2015): 804-815.
- Bor-Chun Chen, Chu-Song Chen, Winston H. Hsu. Cross-Age Reference Coding for Age-Invariant Face Recognition and Retrieval. ECCV (6) 2014: 768-783