List

如何開始你的學術研究(或是帶領你的PhD學生)?

明天(10/26)在 GTC Taiwan 2017 中特別的 track — AI Symposium(與科技部合辦),針對台灣的研究以及政府單位人員,我有40分鐘的演講,太多東西值得分享,必須取捨。
有一張我一直很喜歡的投影片得割捨,可是這又是我這幾年帶領研究團隊最重要的方針。
2007年回台北,我還在困惑該怎樣帶領研究團隊的時候,很榮幸受到微軟研究院的邀請,參加他們一年一度的 Microsoft Research Asia Faculty Summit。
會場中Turing Award (1986) 得主, Prof. John Hopcroft,分享了是以怎樣的作法(跟標準)來帶領博士班學生。他的學生中也已經有人拿到Turing Award。
他提到。
  1. Position yourself for the future
  2. Ignore well established open problems
  3. Formulate new direction of area
  4. Start simple!!
  5. Get international visibility; encourage your students to submit to top conferences

有些想法跟國內的要求的主流 KPI 似乎不盡相同。不過當下我完全採納,因為這些做法,也是我在Columbia的博士班指導教授帶領我的方式。

簡言之。開創新的領域、置身於未來的世界、國際競爭力、參與頂尖國際會議。

很高興的是,多年之後,回頭檢視,很慶幸能夠堅持以這樣(非台灣主流的)標準來帶領我的研究團隊。讓我們在國際的研究社群、產業界,還保有一定的地位。我們的研究團隊,更是國際上具有競爭力的人才庫。

 

  Category: Students

9 posts
October 28th, 2017

How to Get Started in (PhD) Research (如何帶領你的PhD學生)

如何開始你的學術研究(或是帶領你的PhD學生)? 明天(10/26)在 GTC Taiwan 2017 中特別的 track — AI Symposium(與科技部合辦),針對台灣的研究以及政府單位人員,我有40分鐘的演講,太多東西值得分享,必須取捨。 有一張我一直很喜歡的投影片得割捨,可是這又是我這幾年帶領研究團隊最重要的方針。 2007年回台北,我還在困惑該怎樣帶領研究團隊的時候,很榮幸受到微軟研究院的邀請,參加他們一年一度的 Microsoft Research Asia Faculty Summit。 會場中Turing Award (1986) 得主, Prof. John […]

October 25th, 2017

Technical Debt — 沒有白吃的午餐

  十月初Intel副總兼CTO Amir Khosrowshahi 來台,有機會交流。Amir說明Intel在未來智能服務的定位。其中提到了NIPS 2015 Sculley的論文中 “Technical Debt” (技術債)的概念。 很有趣的一個名詞,用來解釋天下沒有白吃的午餐 — 智能化當然是相當重要的未來,但是也得搭配其他不可或缺的要件。  很快的把Sculley的論文看了,主要討論智能元件上線之後,對於線上的工程系統有怎樣的工程挑戰:比如說如何維持特徵值擷取版本,過多的特徵值,訓練模型的版本等等。 值得工程人員關注。  其中最有意思的是這張圖,核心智能(機器學習或是深度學習)常常只是工程系統中的一小部分,為了讓整個服務可以完整的運行,還有其他重要配合的工程部分,例如資料收集、清理、運算資源管理、運算平台、監控服務等。Intel想提供圖一上的大部分,不是只有ML核心。  每個有價值的垂直領域,都有專業的知識,需要時間、成本累積。從一年多前開始跟醫學領域的人一起合作,完全可以感受到跨領域的挑戰,令人戰戰兢兢。  技術債可以用(素質好)的人力彌補,例如挖角、併購,但是價格高。  同樣的,對於非以IT技術擅長的產業,即時是獲利非常良好的隱形冠軍們,要智能化在公司內部開始產生效益,也需要相當的時間跟花費(同樣的,有許多技術債得償還)。當然,經營層的決心是最關鍵的。  這也可能是許多(新創)公司的機會所在。尤其是專注服務於產出大量資料,以及資料單位價值高的幾個領域:例如製造、能源、健康醫療、交通、IT等,都是值得大量投資智能技術的領域。 […]

August 29th, 2017

Interview by Harvard Business Review (哈佛商業評論) on How to Grow the (AI) Talents

My personal views in how we grow and train the top (AI) talents — an interview by Harvard Business Review […]

June 9th, 2017

Team management, productivity, and appreciation

How to make a team of two dozens excellent students competitive and motivated? I am always wondering how my students […]

May 24th, 2017

Image to Poetry — 看圖造新詩

It’s great that, collaborating with Microsoft Research Asia, our MS student Wen-Feng Cheng provides the technical cores for “image to […]

March 29th, 2017

Sammy winning Google PhD Fellowship 2017!

What a wonderful day to know that our former master student, Yu Chuan Su, was awarded Google PhD Fellowship 2017. […]

March 21st, 2017

How to start a research problem (or industry product)? 如何開始一個研究(或是產品)?

2010年參加微軟主辦的Faculty Summit時,Turing Award winner Prof. John Hopcroft,分享了他是如何帶領(博士班)學生: Position yourself for the future Ignore well established open problems Formulate new direction […]

March 19th, 2017

互補 vs. 互斥 (深度影像分析的實用性?)

最近有機會跟數位媒體跟產業界的朋友交流,大家一方面驚訝深度學習技術的進步,另一方面又懷疑這樣的技術突破影響面能有多廣? 是的,很少人需要自動辨識狗或是貓,也不在乎AlphaGo打贏人類棋士。但是可以另一個方式思考—目前已經有接近商業化的技術可以用來彌補人類不足或是不擅長的工作。比如說我們可以使用比較具有擴展性(scalable)、有效率(efficiency)、或是高性價比的方式來協助個人或是商業上的應用。 對於機器智能以及人類的關係,我喜歡尋找 「互補」(complementary)的可能性,而不是「互斥」或是「敵對」的角度。 深度學習技術在影像分析上具有最大的進步(跟語音、文字來比的話)。如果思考的範圍加大,為什麼只用在單一照片?或是單一個攝影機上? 舉例來說,透過大家分享打卡的照片(非常容易取得,我們光是曼哈頓島在2014幾個月內就收集到幾千萬張照片),即使人不到現場,我們可以了解大家究竟點了那些餐點(食物分類)。透過分析這些餐廳出現的人像屬性(facial attributes),例如性別、種族、年紀、打扮,我們可以參考是否適合自己,適合帶小孩,適合怎樣的dressing code。如果再把這個人像屬性偵測擴展到其他景點、商店,更可以了解到這些大量地點的人口統計特性(demographics),直接幫助景點推薦。 事實上我們在ACM Multimedia 2011年就實現了這個全新角度,可以參考[2],這個論點也在研究社群內廣為流傳,我們的相關論文也有145個Google citation。當時,為了驗證這個想法,我們收集了全球19個主要都市,一千多萬張照片,實驗證明加上自動影像偵測出的人口統計特性,可以增加景點推薦的正確性。而且這些影像分析技術是跨語言的! 可以想像,如果要以人力統計這些景點、都市的人口統計特性,需要多少的時間成本,多少可行性。這就是機器智能技術可以大大助益的地方,而且這些分析結果經年累月會更趨正確,因為可以收集到的影像資料更大量的增長。機器智能彌補了人類的局限性! 有趣的是Li Fei Fei的團隊今年在AAAI也有類似的想法,他們是利用Google Street View上拍到的車輛種類來推估都市的人口統計特性,並且可以關聯於一些社會現象、能源使用等。可以參考。 另一個例子是,我們的博士班畢業生 Kuan-Ting […]

November 5th, 2016

Media report regarding our team’s global competitiveness (人工智慧幫 全球強挖角)

We have been working on machine intelligence over large-scale multimodal data streams for more than 14 years and had witnessed […]