List

Our team won the FIRST PRIZE (with USD $10,000 cash award) in MSR-Bing Image Retrieval Challenge 2013, hosted by Microsoft Research (Redmond) and Bing. The challenge is to judge the relevance of the nearly 80,000 text and image pairs, issued by Microsoft within 12 seconds. Our team is ranked the first with the highest accuracy and least computation cost. The award is presented in person by Microsoft CTO Dr. Harry Shum, in Bellevue, WA, USA.

研究的極限在哪?

很榮幸,我可以在視覺資料的機器智能研究中跟台灣最好的研究團隊一起工作。我一直深信我們的學生們有著最好的資質、數理基礎,而且使用著最好的計算設備。

在資訊領域,我們清楚知道競爭對手以及機會都是來自於全世界!

但是同樣的資質、同樣的環境,每個人的差異在哪? 九年多來,我發現每個優異的生命,表現決定於「為自己劃下的那一條線在哪裏」或是「給自己多少的勇氣與機會」。

照片是我們團隊參加2013年美國微軟研究院所舉辦的「影像搜尋競賽」(MSR-Bing Image Retrieval Challenge),會參加這個比賽的原因是有人發現這個第一次舉辦的研究競賽,第一名獎金是一萬美金,所以就興起組隊參加的念頭。

既然組隊,我們就要衝出最好的結果。

為這項競賽,我們必須在實驗室內準備一套系統接收微軟由遠端送進來的近八萬筆文字和影像資料,然後在12秒內判別出每筆文字和影像間的相關度。考驗我們的工程能力以及大規模影像搜尋技術。我們利用廣達慷慨捐贈的廣達雲(感謝廣達研究院院長Dr. Ted Chang的傾力協助),事先在兩千三百萬筆訓練資料上進行機器學習,準備好多種影像辨識引擎以及檢索資料。

當然在這些大量的Web影像中要有正確的比對是十分困難的。團隊嘗試過各種方法都無法將正確率往上推升,僵持中,放棄總是最廉價的選項。在最後幾天,赫然發現傳統方法在這些影像上的局限性,進而大膽採用了不同的機器學習策略,結果停滯許久的正確率開始往上提升。最後結果揭曉,在全球參賽者中以最短時間以及最高正確率獲得年度冠軍。

之後團隊受邀到西雅圖接受微軟技術長(CTO) Dr. Harry Shum(照片左三)親自頒獎。左一的Kuan-Yu Chu碩士班畢業之後直接被美國微軟延攬,左二Yan-Ying Chen 的也在博士班畢業之後直接到矽谷的FXPAL研究中心擔任研究員。當然還包括Chun-Che Wu, Yin-Hsi Kuo, Wen-Yu Lee

極限在哪?我深信,止於為自己劃下的那一條線。

 

  Posts

1 2 3 6
June 7th, 2018

First Place (#1) in Disguised Face Recognition in CVPR 2018

January 6th, 2019

意想不到的科技部「AI投資潛力獎第一名」

December 16th, 2018

Keep Recruiting for Machine Learning Research Partners for Numerous Visual Sensors

December 16th, 2018

FutureTech Demo and Breakthrough Award (未來科技突破獎)

October 12th, 2018

結合虛與實的試鞋生成網路 (Virtual Try-On Shoe with Generative Neural Networks)

我們都有這樣的困擾,在電子購物的時候,看到一雙好看的鞋子,想買。但是卻又拿不定主意自己穿起來好看嗎?或是搭配某件褲子適合嗎?怎麼讓網路虛擬商城的鞋子,可以有效試在自己的腳上呢? 這個工作的挑戰在於如何使用單張鞋子商品的照片,很自然的合成在使用者的腳上,而且腳可能會有各種姿勢、角度。如何客服這個問題? 很高興大學部專題生(EE) 周晁德 完成了這個 PIVTONS 的虛擬鞋子試穿生成網路,試著解決這個困擾大家很久的問題。 這個有趣的工作也將於十二月初,在澳洲珀斯舉辦 Asian Conference on Computer Vision (ACCV) 2018 以大會演說 (Oral) 的方式跟大家分享這個工作。接下來全新的測試資料集將會公開讓大家使用,如果可以的話,我們也將試試看將整個試穿生成系統上線,讓大家體驗虛擬試鞋的樂趣 — 可以多試穿,多省錢。 我們鼓勵high-risk的研究工作。令人慶幸的是,這工作的發想、資料收集都是專題生獨立完成。當然在過程當中遇到很多GAN生成的問題,網路設計、訓練的問題,幾乎放棄了,還好團隊成員一起想辦法解決,關關難過,關關過(甚至免費擔任model),讓這個兼具技術深度以及商業價值的系統,可以順利完成。 我們也一直努力,讓智能生成(或是辨識)系統,賦予更有意義的應用 […]

September 13th, 2018

Finalist (Top 3) in 2018 IEEE Signal Processing Society Video and Image Processing (VIP) Cup

July 29th, 2018

信手拈來的3D模型搜尋 (Cross-View and Cross-Domain 3D Model Search)

July 27th, 2018

低解析人臉辨識跟解析度放大 (Very Low-Resolution Face Hallucination and Recognition)

June 18th, 2018

Winning Third Place in CVPR 2018 Video Recognition Challenge — Moments in Time

June 13th, 2018

[Video Report] National Investment for the GPU Supercomputer?

June 9th, 2018

Amazing Crowd Size and Positive Feedbacks in the Deep Learning Lecture for GTC 2018 Taipei