List

It’s an amazing journey! I am having my sabbatical leave in IBM TJ Watson Research Center, New York. I am so grateful to work with John Smith, Benoit Huet, and Dhiraj Joshi for the first movie AI trailer by Watson. It’s to our surprise that the impacts are huge — the team are also recognized with 2016 IBM Research Image Award for the e technology, industry, and media impacts.

—————

很幸運在(2007年二月)回到台大九年之後,可以在2016年的暑假開始我的第一個休假研究(預計到2017年暑假為止)。與其到安靜熟悉的校園,我選擇到紐約州的IBM TJ Watson研究中心,並參與Watson人工智慧研究群的電腦視覺部門。

上帝都為我們安排好了一套劇本。

報到前在機上還擔心不知從何開始,結果報到第一天,就開始了這趟驚奇的旅程。和其他三位研究員,我們接到了福斯電影公司的要求,希望能用Watson AI技術為即將上映的院線片「Morgan」,自動剪接出電影預告片。

這是一個挑戰,原因不在於技術,我們有把握目前的視覺以及語音/音樂上的深度學習技術可以幫上大大的忙。問題在訓練資料,即使網路上有許多剪接好的預告片,但是沒有原始的完整電影,原本想利用Sequence to Squence的作法似乎不可行。還好有人想到利用生成模型(generative model)的方式,來找出這些(驚悚)預告片的主要元素。

位於加州的福斯電影公司,在看過設計的演算法自動挑出的十個電影片段之後,大為激賞,決定讓Watson放手一博,接著院內的設計人員配上音樂。樣本接下來傳到加州,用了更高畫質的電影畫面以及音樂,就上傳到YouTube上。也就是這個片段。

據說一個電影預告片需要專業人員一個月的時間工作,以目前AI的作法大大縮短了時程!

事實上這部電影並不賣座,但是媒體對這個Watson AI 預告片的熱烈報導,出乎大家的意料之外。一星期內超過兩百三十幾萬人觀賞。我也學到這家百年大型企業如何與媒體合作、如何看待、計算、追蹤分析媒體效益。

長官們對於這個突如其來的研究效益大為激賞,團隊也獲得研究中心內 2016 IBM Research Image Award。

當然陸續引進了其他企業客戶的商業機會。有幸參加幾次企業客戶的會議,片面觀察到B2B在乎的要求與模式。更幸運的是年初有機會參與IBM CEO/Chairwoman, Ginni Rometty所召開的小型會議,了解這樣的技術對企業客戶的機會在哪。

這是一趟出乎意料的旅程,我還懷著喜悅的心情繼續進行著手中的prototype,這個新嘗試,對於未來媒體管理、機器人的視覺感知,可能都是第一次的嘗試。也慶幸在「說」了九年的研究之後,也可讓自己「撩」下去,親自體驗這些深度學習技術的迷人之處。

特別珍惜休假研究這幾個月來參與的計劃以及IBM內對Watson AI技術高度的投入,我也認為AI技術對於B2B或是企業為主的商業模式特別有意義。

同時在自己動手做的這幾個月當中,我也羨慕我在台北的20幾個人團隊可以使用最好的設備,進行著深具挑戰、有趣、充滿機會的AI問題—特別是在大規模的影像以及視訊資料!

  Posts

1 2 3 6
June 7th, 2018

First Place (#1) in Disguised Face Recognition in CVPR 2018

January 6th, 2019

意想不到的科技部「AI投資潛力獎第一名」

December 16th, 2018

Keep Recruiting for Machine Learning Research Partners for Numerous Visual Sensors

December 16th, 2018

FutureTech Demo and Breakthrough Award (未來科技突破獎)

October 12th, 2018

結合虛與實的試鞋生成網路 (Virtual Try-On Shoe with Generative Neural Networks)

我們都有這樣的困擾,在電子購物的時候,看到一雙好看的鞋子,想買。但是卻又拿不定主意自己穿起來好看嗎?或是搭配某件褲子適合嗎?怎麼讓網路虛擬商城的鞋子,可以有效試在自己的腳上呢? 這個工作的挑戰在於如何使用單張鞋子商品的照片,很自然的合成在使用者的腳上,而且腳可能會有各種姿勢、角度。如何客服這個問題? 很高興大學部專題生(EE) 周晁德 完成了這個 PIVTONS 的虛擬鞋子試穿生成網路,試著解決這個困擾大家很久的問題。 這個有趣的工作也將於十二月初,在澳洲珀斯舉辦 Asian Conference on Computer Vision (ACCV) 2018 以大會演說 (Oral) 的方式跟大家分享這個工作。接下來全新的測試資料集將會公開讓大家使用,如果可以的話,我們也將試試看將整個試穿生成系統上線,讓大家體驗虛擬試鞋的樂趣 — 可以多試穿,多省錢。 我們鼓勵high-risk的研究工作。令人慶幸的是,這工作的發想、資料收集都是專題生獨立完成。當然在過程當中遇到很多GAN生成的問題,網路設計、訓練的問題,幾乎放棄了,還好團隊成員一起想辦法解決,關關難過,關關過(甚至免費擔任model),讓這個兼具技術深度以及商業價值的系統,可以順利完成。 我們也一直努力,讓智能生成(或是辨識)系統,賦予更有意義的應用 […]

September 13th, 2018

Finalist (Top 3) in 2018 IEEE Signal Processing Society Video and Image Processing (VIP) Cup

July 29th, 2018

信手拈來的3D模型搜尋 (Cross-View and Cross-Domain 3D Model Search)

July 27th, 2018

低解析人臉辨識跟解析度放大 (Very Low-Resolution Face Hallucination and Recognition)

June 18th, 2018

Winning Third Place in CVPR 2018 Video Recognition Challenge — Moments in Time

June 13th, 2018

[Video Report] National Investment for the GPU Supercomputer?

June 9th, 2018

Amazing Crowd Size and Positive Feedbacks in the Deep Learning Lecture for GTC 2018 Taipei