List

想像一下,如果在家裡一堆數位照片中,要翻出某張照片,你得花費多少時間?

家中有小孩的家庭,常會為了尋找照片而煩惱(例如繳交寒暑假作業)。尤其是家中數位相片持續大量累積中,這個問題其實越來越麻煩。

明明心中想著那張照片的畫面,可是怎麼也找不到!

我們在2011年聽到許多媽媽們(還有爸爸們)的需要,提出了search by impression的概念。在幾十萬張的照片中,協助快速找到那張記憶中的畫面。同時也補足文字標註、人臉辨識、以及以圖找圖技術的不足。

相當多的統計指出,使用者照片中帶有人像的照片大概超過80%。而且MIT的研究也發現,多年之後,有人臉的照片是大家最記得的。

所以我們設計了全新的使用者照片的搜尋方式,按照使用者印象中的畫面,利用人臉位置、大小、排出記憶中的輪廓,結合人臉屬性偵測,檢索前每張人臉自動偵測出性別、種族、膚色、年紀、打扮等,來額外輔助描述記憶中的畫面。例如印象中姊妹淘出遊的畫面,三位(年輕)女性緊靠在一起;爺爺奶奶和孫子的合照,爺爺(資深男性)在左,奶奶(資深女性)在右等。 Demo影片可以清楚呈現實際的使用畫面。

解決實際問題的研究不容於學術的頂級殿堂嗎?

當我們為了確保在幾十萬張的照片中依舊維持搜索的正確率以及效率,我們就得嘗試設計第一次同時為偵測出的人臉屬性、高維度人臉特徵值、人臉位置、大小等截然不同的資料型態建立全新整合的檢索方式。如何評估效能?如何設計全新的UI?

當嚴謹地面對這些挑戰,自然會在重要的場合讓人驚豔。初試啼聲,就在美國亞利桑那舉辦的頂級多媒體會議ACM Multimeida 獲得Grand Challenge 首獎[1]。完整的技術也在搜尋技術的大會ACM SIGIR以Full Paper (Oral)發表[2]。因為是全新在觸控螢幕上的搜尋技術,我們也申請了美國專利,也曾經讓某家矽谷領導品牌的影像公司談到技術授權。

嚴謹跟解決實際問題並不衝突。

如果我們習慣設身處地思考一般使用者的需要?那也很自然可以思考製造業、電商、營建的可能需求。他們有怎樣的痛點,為了營運而累積大量的複雜多樣性資料,該如何協助智慧分析?轉換適當的KPI,搞不好就是另一個有機會的產品。

[1] Yu-Heng Lei, Yan-Ying Chen, Bor-Chun Chen, Lime Iida, Winston H. Hsu: Where is who: large-scale photo retrieval by facial attributes and canvas layout. SIGIR 2012: 701-710

[2] Yu-Heng Lei, Yan-Ying Chen, Lime Iida, Bor-Chun Chen, Hsiao-Hang Su, Winston H. Hsu: Photo search by face positions and facial attributes on touch devices. ACM Multimedia 2011: 651-654. [FIRST Prize in ACM Multimedia Grand Challenge 2011]

 

  Posts

1 2 3 6
June 7th, 2018

First Place (#1) in Disguised Face Recognition in CVPR 2018

January 6th, 2019

意想不到的科技部「AI投資潛力獎第一名」

December 16th, 2018

Keep Recruiting for Machine Learning Research Partners for Numerous Visual Sensors

December 16th, 2018

FutureTech Demo and Breakthrough Award (未來科技突破獎)

October 12th, 2018

結合虛與實的試鞋生成網路 (Virtual Try-On Shoe with Generative Neural Networks)

我們都有這樣的困擾,在電子購物的時候,看到一雙好看的鞋子,想買。但是卻又拿不定主意自己穿起來好看嗎?或是搭配某件褲子適合嗎?怎麼讓網路虛擬商城的鞋子,可以有效試在自己的腳上呢? 這個工作的挑戰在於如何使用單張鞋子商品的照片,很自然的合成在使用者的腳上,而且腳可能會有各種姿勢、角度。如何客服這個問題? 很高興大學部專題生(EE) 周晁德 完成了這個 PIVTONS 的虛擬鞋子試穿生成網路,試著解決這個困擾大家很久的問題。 這個有趣的工作也將於十二月初,在澳洲珀斯舉辦 Asian Conference on Computer Vision (ACCV) 2018 以大會演說 (Oral) 的方式跟大家分享這個工作。接下來全新的測試資料集將會公開讓大家使用,如果可以的話,我們也將試試看將整個試穿生成系統上線,讓大家體驗虛擬試鞋的樂趣 — 可以多試穿,多省錢。 我們鼓勵high-risk的研究工作。令人慶幸的是,這工作的發想、資料收集都是專題生獨立完成。當然在過程當中遇到很多GAN生成的問題,網路設計、訓練的問題,幾乎放棄了,還好團隊成員一起想辦法解決,關關難過,關關過(甚至免費擔任model),讓這個兼具技術深度以及商業價值的系統,可以順利完成。 我們也一直努力,讓智能生成(或是辨識)系統,賦予更有意義的應用 […]

September 13th, 2018

Finalist (Top 3) in 2018 IEEE Signal Processing Society Video and Image Processing (VIP) Cup

July 29th, 2018

信手拈來的3D模型搜尋 (Cross-View and Cross-Domain 3D Model Search)

July 27th, 2018

低解析人臉辨識跟解析度放大 (Very Low-Resolution Face Hallucination and Recognition)

June 18th, 2018

Winning Third Place in CVPR 2018 Video Recognition Challenge — Moments in Time

June 13th, 2018

[Video Report] National Investment for the GPU Supercomputer?

June 9th, 2018

Amazing Crowd Size and Positive Feedbacks in the Deep Learning Lecture for GTC 2018 Taipei