face verification – Winston HSU (徐宏民) | Scientist enthusiastic for machine intelligence and deep learning over large-scale image/video streams

List

Data-Drive Strategy（以資料制資料）

March 27, 2017 | winston | Awards, Publications, Thinking | CACD, face recognition, face verification

在機器智能的運用上，困難的問題，一般會利用（1）採用更複雜的模型（如數十層的類神經網路），或是（2）提供更多標註過的訓練資料。但是資料標註的代價（所需準備的時間以及金錢）是相當昂貴的。尤其時間是產業應用上，時間是相當貴重的成本。

另一個想法：如果可以善用Internet上隨手可得的資料，有時候複雜困難的問題，會有意想不到的突破！

之前我們嘗試解決人臉辨識上一個未解的問題—「跨年紀人臉辨識」。如果使用face verification的定義的話，我們得決定任兩張（相距五到十年）的照片，是否屬於同一人。

大家可以參考看看這張照片，猜測一下，屬於同一個人嗎？

跨年紀人臉辨識，在兩年前還是十分困難的問題。過去以來，大家考慮的是尋找逼近老化的方程式，或是找出不受年齡影響 (age-invariant)的人臉特徵表示方法。可是人類老化是個複雜的model，所以一直無法突破。

我們（Sirius Chen 以及 Dr. Chu-Song Chen）則大膽採用了另一個全新的策略。我們以網路上隨手可得的名人照片來表示（解釋）人像；比如說某個人鼻子長得像明星A、嘴巴像明星B、下巴像明星C，等（約數百位名人）。如此一來，沒有例外，大家都會經過類似的老化過程。因此這個人和名人A、B、C等在某個部位還是維持相似性。我們就用這樣的表示法來代表人臉特徵值（過程使用sparse coding、 high-dimensional LBP、max pooling實現）。

有趣的是這些名人照片數量之多，資料之詳盡（出生年、年紀、性別等），遠超過我們當初的想像。為了支持我們的實驗，我們收集到最大的跨年齡人臉辨識資料庫，2000位世界名人，橫跨約10年，超過十六萬張照片。我們也將這第一個跨年齡的人臉辨識資料，公開讓研究社區使用，稱為 Cross-Age Celebrity Dataset (CACD)跨年齡名人資料庫。

很驚訝的，效果遠超過當時的所有方法。我們也發現這個 Data-Driven的跨年齡人臉辨識方法，在2015年就已經超越一般人的極限。我們在Amazon MTurk （付費）收集到四萬人次如照片中的辨識實驗。經過統計，人類的平均跨年齡辨識率為85.7%。而我們提出的「以資料制資料」的方法，正確率為87.6%。

顯然地，合理、robust的演算法，在足夠（並兼具多樣性、正確性等）的資料下，可以大大的勝出。這也隱含如果針對某些應用領域，以合理的成本善用資料，對於許多看似艱難的問題，都可以有另人驚豔的突破！

Chen, Bor-Chun, Chu-Song Chen, and Winston H. Hsu. “Face recognition and retrieval using cross-age reference coding with cross-age celebrity dataset.” IEEE Transactions on Multimedia 17.6 (2015): 804-815.
Bor-Chun Chen, Chu-Song Chen, Winston H. Hsu. Cross-Age Reference Coding for Age-Invariant Face Recognition and Retrieval. ECCV (6) 2014: 768-783

Tag: face verification

March 27th, 2017

Data-Drive Strategy（以資料制資料）

在機器智能的運用上，困難的問題，一般會利用（1）採用更複雜的模型（如數十層的類神經網路），或是（2）提供更多標註過的訓練資料。但是資料標註的代價（所需準備的時間以及金錢）是相當昂貴的。尤其時間是產業應用上，時間是相當貴重的成本。另一個想法：如果可以善用Internet上隨手可得的資料，有時候複雜困難的問題，會有意想不到的突破！之前我們嘗試解決人臉辨識上一個未解的問題—「跨年紀人臉辨識」。如果使用face verification的定義的話，我們得決定任兩張（相距五到十年）的照片，是否屬於同一人。大家可以參考看看這張照片，猜測一下，屬於同一個人嗎？跨年紀人臉辨識，在兩年前還是十分困難的問題。過去以來，大家考慮的是尋找逼近老化的方程式，或是找出不受年齡影響 (age-invariant)的人臉特徵表示方法。可是人類老化是個複雜的model，所以一直無法突破。我們（Sirius Chen 以及 Dr. Chu-Song Chen）則大膽採用了另一個全新的策略。我們以網路上隨手可得的名人照片來表示（解釋）人像；比如說某個人鼻子長得像明星A、嘴巴像明星B、下巴像明星C，等（約數百位名人）。如此一來，沒有例外，大家都會經過類似的老化過程。因此這個人和名人A、B、C等在某個部位還是維持相似性。我們就用這樣的表示法來代表人臉特徵值（過程使用sparse coding、 high-dimensional LBP、max pooling實現）。 […]

Winston H. Hsu

National Taiwan University

Data-Drive Strategy（以資料制資料 ）

Tag: face verification

Data-Drive Strategy（以資料制資料 ）

Data-Drive Strategy（以資料制資料）

Data-Drive Strategy（以資料制資料）