List

Our team won the FIRST PRIZE (with USD $10,000 cash award) in MSR-Bing Image Retrieval Challenge 2013, hosted by Microsoft Research (Redmond) and Bing. The challenge is to judge the relevance of the nearly 80,000 text and image pairs, issued by Microsoft within 12 seconds. Our team is ranked the first with the highest accuracy and least computation cost. The award is presented in person by Microsoft CTO Dr. Harry Shum, in Bellevue, WA, USA.

研究的極限在哪?

很榮幸,我可以在視覺資料的機器智能研究中跟台灣最好的研究團隊一起工作。我一直深信我們的學生們有著最好的資質、數理基礎,而且使用著最好的計算設備。

在資訊領域,我們清楚知道競爭對手以及機會都是來自於全世界!

但是同樣的資質、同樣的環境,每個人的差異在哪? 九年多來,我發現每個優異的生命,表現決定於「為自己劃下的那一條線在哪裏」或是「給自己多少的勇氣與機會」。

照片是我們團隊參加2013年美國微軟研究院所舉辦的「影像搜尋競賽」(MSR-Bing Image Retrieval Challenge),會參加這個比賽的原因是有人發現這個第一次舉辦的研究競賽,第一名獎金是一萬美金,所以就興起組隊參加的念頭。

既然組隊,我們就要衝出最好的結果。

為這項競賽,我們必須在實驗室內準備一套系統接收微軟由遠端送進來的近八萬筆文字和影像資料,然後在12秒內判別出每筆文字和影像間的相關度。考驗我們的工程能力以及大規模影像搜尋技術。我們利用廣達慷慨捐贈的廣達雲(感謝廣達研究院院長Dr. Ted Chang的傾力協助),事先在兩千三百萬筆訓練資料上進行機器學習,準備好多種影像辨識引擎以及檢索資料。

當然在這些大量的Web影像中要有正確的比對是十分困難的。團隊嘗試過各種方法都無法將正確率往上推升,僵持中,放棄總是最廉價的選項。在最後幾天,赫然發現傳統方法在這些影像上的局限性,進而大膽採用了不同的機器學習策略,結果停滯許久的正確率開始往上提升。最後結果揭曉,在全球參賽者中以最短時間以及最高正確率獲得年度冠軍。

之後團隊受邀到西雅圖接受微軟技術長(CTO) Dr. Harry Shum(照片左三)親自頒獎。左一的Kuan-Yu Chu碩士班畢業之後直接被美國微軟延攬,左二Yan-Ying Chen 的也在博士班畢業之後直接到矽谷的FXPAL研究中心擔任研究員。當然還包括Chun-Che Wu, Yin-Hsi Kuo, Wen-Yu Lee

極限在哪?我深信,止於為自己劃下的那一條線。

 

  Posts

1 2 3 4
July 25th, 2017

Our CVPR 2017 Paper Highlighted in NVIDIA Corporate Blog

July 24th, 2017

NVIDIA AI Lab Meetup in CVPR 2017 and new V100 GPUs

July 18th, 2017

Drone-View Object Localization/Counting and Public Vehicle Dataset (CARPK)

July 2nd, 2017

Publications vs. Industry Needs (發表學術論文跟產業脫節?)

June 9th, 2017

Team management, productivity, and appreciation

June 1st, 2017

Practical advises for embracing AI-savvy products (Hosting AI Forum in InnoVEX 2017)

May 24th, 2017

Image to Poetry — 看圖造新詩

May 15th, 2017

島內AI的隱形驅動力

前陣子協助 天下雜誌 副總編輯 Yi-Shan Chen 完成AI專輯 [AI全面啟動Ⅰ:科技島國的翻身契機]。 我在紐約,這段時間,Yi-Shan透過FB的訪談跟資料詢問,我感受到她的焦慮,急著摸清楚這個浪潮的來龍去脈,以及我們該做的、或是已經做到的。 初稿完成,正如Yi-Shan所說的,她不那麼悲觀了。或是說我們也沒有悲觀的權利。 我的觀察。 2016年初開始,國內幾家領先企業也開始注意到AI(深度學習)浪潮可能對公司的影響。已經開始研究如何在既有的核心業務上善用這些前瞻技術。 這不是將開源的類神經網路拿來使用就好、或是付費API可以全然解決。首先產品需要的偵測/辨識的項目跟benchmark資料完全不同、產品大部分是multi-label的問題而不是大家常討論的multi-class、訓練資料的取得跟缺乏、應用場域資料型態差異、學習model的參數過大、耗電、運算時間、或是在使用者端自動調適學習等。產品佈建跟論文討論的範疇有著相當大的差異。 領導者(執行長、董事長)的決心是最關鍵的問題。因為引進新的機器學習paradigm之後,牽涉到資源配置、薪資結構、產品pipeline(如使用者資料收集、AI引擎的更新)、新產品的定位等,需要很大的決心。 缺乏深度學習技術的研究人員是第二個問題。在協助幾個團隊之後發現,台灣的數理教育品質相對優良,理工科碩士論文要求對於前瞻的研究是很有幫助的。 在組織具有某些特質的工程師之後,透過適當的做中學、學中做的過程,還有我們十幾年在影像/視訊上成功跟失敗的經驗,是可以逐漸訓練出內部深度學習基本研發團隊、也能適性地將技術調整到適合的產品線上。 目前已經看到這樣的技術成果用在解決監控系統上常見的誤判的問題、照片標註、辨識、自動分類、edge端的精簡深度學習模型、或是利用各種感測器、攝影機進行未來事件預測等。甚至有些已經上線進行A/B test,交付給客戶的PoC、或是取代原本沒效率的人工分類等。 在這次的訪問當中,也將這幾個領先企業介紹給天下雜誌,但是因為公司內部的marketing跟財務時程,還不能公開披露目前的結果。 我們不選擇悲觀、抱怨、譏笑。許多團隊,也早就捲起袖子為企業帶來更具有競爭力的AI(深度學習)能力,開啟新的產品思維,如同全球企業忙著乘著巨浪向前。也感謝 天下雜誌 […]

May 10th, 2017

Quick and incomplete observations from GTC 2017

May 9th, 2017

2017 Microsoft Research Asia Collaborative Research Project Granted