List

我們都有這樣的困擾,在電子購物的時候,看到一雙好看的鞋子,想買。但是卻又拿不定主意自己穿起來好看嗎?或是搭配某件褲子適合嗎?怎麼讓網路虛擬商城的鞋子,可以有效試在自己的腳上呢?

這個工作的挑戰在於如何使用單張鞋子商品的照片,很自然的合成在使用者的腳上,而且腳可能會有各種姿勢、角度。如何客服這個問題?

很高興大學部專題生(EE) 周晁德 完成了這個 PIVTONS 的虛擬鞋子試穿生成網路,試著解決這個困擾大家很久的問題。 這個有趣的工作也將於十二月初,在澳洲珀斯舉辦 Asian Conference on Computer Vision (ACCV) 2018 以大會演說 (Oral) 的方式跟大家分享這個工作。接下來全新的測試資料集將會公開讓大家使用,如果可以的話,我們也將試試看將整個試穿生成系統上線,讓大家體驗虛擬試鞋的樂趣 — 可以多試穿,多省錢。

我們鼓勵high-risk的研究工作。令人慶幸的是,這工作的發想、資料收集都是專題生獨立完成。當然在過程當中遇到很多GAN生成的問題,網路設計、訓練的問題,幾乎放棄了,還好團隊成員一起想辦法解決,關關難過,關關過(甚至免費擔任model),讓這個兼具技術深度以及商業價值的系統,可以順利完成。

我們也一直努力,讓智能生成(或是辨識)系統,賦予更有意義的應用 — 用以提升個人或是企業的「效率」、「生產力」、以及「安全」。

Virtual try-on — synthesizing an almost-realistic image for dressing a target fashion item provided the source human photo — has growing needs due to the prevalence of e-commerce and the development of deep learning technologies. We present pose invariant virtual try-on shoe (PIVITONS) to cope with virtual try-on shoe. The shoe image only shows a single view of the shoe but the try-on result should show other views of the shoe depending on the original pose of feet. We formulate that as an automatic and labor-free image completion task and design an end-to-end neural networks composing of feature point detector. By combing three losses for image generation, we can synthesize realistic results. The work will be presented as an ORAL paper in ACCV 2018.

PIVTONS: Pose Invariant Virtual Try-On Shoe with Conditional Image Completion. Chao-Te Chou, Cheng-Han Lee, Kaipeng Zhang, Hu Cheng Lee, Winston H. Hsu. Asian Conference on Computer Vision (ACCV) 2018

Download the paper here:
https://winstonhsu.info/pubs/pivtons-virtual-try-on-shoe/

  Category: Publications

1 2
October 12th, 2018

結合虛與實的試鞋生成網路 (Virtual Try-On Shoe with Generative Neural Networks)

我們都有這樣的困擾,在電子購物的時候,看到一雙好看的鞋子,想買。但是卻又拿不定主意自己穿起來好看嗎?或是搭配某件褲子適合嗎?怎麼讓網路虛擬商城的鞋子,可以有效試在自己的腳上呢? 這個工作的挑戰在於如何使用單張鞋子商品的照片,很自然的合成在使用者的腳上,而且腳可能會有各種姿勢、角度。如何客服這個問題? 很高興大學部專題生(EE) 周晁德 完成了這個 PIVTONS 的虛擬鞋子試穿生成網路,試著解決這個困擾大家很久的問題。 這個有趣的工作也將於十二月初,在澳洲珀斯舉辦 Asian Conference on Computer Vision (ACCV) 2018 以大會演說 (Oral) 的方式跟大家分享這個工作。接下來全新的測試資料集將會公開讓大家使用,如果可以的話,我們也將試試看將整個試穿生成系統上線,讓大家體驗虛擬試鞋的樂趣 — 可以多試穿,多省錢。 我們鼓勵high-risk的研究工作。令人慶幸的是,這工作的發想、資料收集都是專題生獨立完成。當然在過程當中遇到很多GAN生成的問題,網路設計、訓練的問題,幾乎放棄了,還好團隊成員一起想辦法解決,關關難過,關關過(甚至免費擔任model),讓這個兼具技術深度以及商業價值的系統,可以順利完成。 我們也一直努力,讓智能生成(或是辨識)系統,賦予更有意義的應用 […]

July 29th, 2018

信手拈來的3D模型搜尋 (Cross-View and Cross-Domain 3D Model Search)

We propose a cross-domain image-based 3D shape retrieval method, which learns a joint embedding space for natural images and 3D […]

July 27th, 2018

低解析人臉辨識跟解析度放大 (Very Low-Resolution Face Hallucination and Recognition)

Low-resolution face hallucination (or recognition) is a common need for security reasons as the captured suspect of interest is generally […]

June 13th, 2018

[Video Report] National Investment for the GPU Supercomputer?

National Investment for the GPU Supercomputer? ==================================== Thanks to the nice video report (in Mandarin) by TVBS News. Our team […]

June 9th, 2018

Research in Medical Image Segmentation Highlighted in GTC 2018 Taipei by NVIDIA CEO Huang

It’s the great honor that our team’s work in medical image segmentation for Organ at Risk (OAR) for NPC (鼻咽癌) […]

June 7th, 2018

Drone-View Building Identification: Dataset and the Pilot Work

For navigating the complex surrounding, we envision a proactive and adaptive drone-based building identification technology — recognizing the key buildings […]

June 7th, 2018

First Place (#1) in Disguised Face Recognition in CVPR 2018

Feel proud that the team is ranked #1 (the First Place) in CVPR 2018 Disgusied Face Recognition! Our team just won […]

February 6th, 2018

Public “NetiLook Dataset” for Netizen-Style Commenting on Fashion Photos

你能區分影像社群網站的留言是來自機器還是真實使用者嗎? 從對話機器人、或是我們之前參與的小冰寫詩,我們知道影像與自動文字描述的重要性。超越平鋪直述的影像文字敘述,過去兩年我們研究「鄉民式」的影像自動留言系統,針對流行服飾的社群網站。主要研究如何產生更生動、更多樣性的影像對話內容,結合影像以及文字的深度學習技術。我們發現如何量測「多樣性」、「新鮮感」都是個未探討的議題。 同樣地,我們樂於將先導性研究所採集的大型資料與全球的研究社群分享,也是目前唯一相關研究的資料集。所採集目前含有超過35萬張照片、一萬一千位使用者、五百萬留言的「NetiLook」資料集目前公開下載。 相關技術也將發表在頂尖會議 WWW 2018 (Cognitive Computing Track). 我們並發現,一般使用者很難區分機器產生或是使用者的留言。 Recently, image captioning has appeared promising, which is expected to […]

October 25th, 2017

Technical Debt — 沒有白吃的午餐

  十月初Intel副總兼CTO Amir Khosrowshahi 來台,有機會交流。Amir說明Intel在未來智能服務的定位。其中提到了NIPS 2015 Sculley的論文中 “Technical Debt” (技術債)的概念。 很有趣的一個名詞,用來解釋天下沒有白吃的午餐 — 智能化當然是相當重要的未來,但是也得搭配其他不可或缺的要件。  很快的把Sculley的論文看了,主要討論智能元件上線之後,對於線上的工程系統有怎樣的工程挑戰:比如說如何維持特徵值擷取版本,過多的特徵值,訓練模型的版本等等。 值得工程人員關注。  其中最有意思的是這張圖,核心智能(機器學習或是深度學習)常常只是工程系統中的一小部分,為了讓整個服務可以完整的運行,還有其他重要配合的工程部分,例如資料收集、清理、運算資源管理、運算平台、監控服務等。Intel想提供圖一上的大部分,不是只有ML核心。  每個有價值的垂直領域,都有專業的知識,需要時間、成本累積。從一年多前開始跟醫學領域的人一起合作,完全可以感受到跨領域的挑戰,令人戰戰兢兢。  技術債可以用(素質好)的人力彌補,例如挖角、併購,但是價格高。  同樣的,對於非以IT技術擅長的產業,即時是獲利非常良好的隱形冠軍們,要智能化在公司內部開始產生效益,也需要相當的時間跟花費(同樣的,有許多技術債得償還)。當然,經營層的決心是最關鍵的。  這也可能是許多(新創)公司的機會所在。尤其是專注服務於產出大量資料,以及資料單位價值高的幾個領域:例如製造、能源、健康醫療、交通、IT等,都是值得大量投資智能技術的領域。 […]

July 25th, 2017

Our CVPR 2017 Paper Highlighted in NVIDIA Corporate Blog

It’s a great honor that our work for CVPR 2017 in 3D medical imaging segmentation is highlighted in NVIDIA corporate blog, titled […]