時間:2019-09-17 14:22:04 作者:無名 瀏覽量:46
今天小編就為你們帶來女孩子們最愛的美圖秀秀背后的技術(shù)。長久以來,一提到 “美圖公司”,大家能想到的都是 “美圖秀秀”、“美顏相機”、“美拍” 這些美顏類產(chǎn)品,而為這些產(chǎn)品提供 AI 技術(shù)支持的美圖影像實驗室(以下簡稱 MTlab)一直鮮為人知。
成立于 2010 年的 MTlab,早已不止是一個實驗室 —— 它在美圖產(chǎn)品線背后扮演著 “大腦” 的角色。在 MTlab 的工具箱里,深度學習模型和 TensorFlow 是最有效的利器。
美圖各個產(chǎn)品的功能決定了,MTlab 會大量使用到計算機視覺技術(shù)。
“2013 年開始,MTlab 就用機器學習做計算機視覺方面的研發(fā)。最早做的是人臉相關(guān)技術(shù),以及美顏算法。”MTlab 負責人萬鵬飛告訴 PingWest 品玩,“那時開源工具還沒有現(xiàn)在這么豐富,很多算法和工具需要自己手動實現(xiàn)。”
采用傳統(tǒng)機器學習來做計算機視覺的好處是,整個訓練過程完全透明,允許研發(fā)人員更好地評估訓練出來的算法,是否在訓練環(huán)境之外依然有效。但不足的地方是,人工提取特征的工作量大,而且魯棒性差。
萬鵬飛對 PingWest 品玩表示,當時他們面臨的主要技術(shù)挑戰(zhàn),正是“算法在各種極端用戶使用場景下的魯棒性”。
利用深度學習的卷積神經(jīng)網(wǎng)絡(luò)模型,能很好解決這個問題。“深度學習這種數(shù)據(jù)驅(qū)動的方法,在魯棒性方面比傳統(tǒng)計算機視覺算法有明顯優(yōu)勢。”萬鵬飛說。
決定采用深度學習后,他們最早使用的框架是 Caffe。這個深度學習框架于 2013 年在 Github 上發(fā)布,作者是加州大學伯克利分校的賈揚清博士。
2015 年,Google 發(fā)布深度學習開源框架 TensorFlow,“MTlab 馬上就去了解這個工具”。2016 年,MTlab 開始在項目中嘗試用 TensorFlow。
美圖秀秀讓人們變美麗的背后的技術(shù)圖二
萬鵬飛介紹道,MTlab 用 TensorFlow 最早做的是圖像去噪,整體感覺比較靈活,對自定義的網(wǎng)絡(luò)結(jié)構(gòu)比較友好。一個靈活的深度學習框架對于算法自研很重要,因為很多實際的問題需要通過一些創(chuàng)新的方法解決,而一個好用的深度學習框架無疑能提高計算機視覺算法研發(fā)的效率。
很快,TensorFlow 憑借著靈活的特性成為了他們主要的深度學習框架。2016 年 MTlab 在用深度學習做人像分割功能時,初期使用 Caffe 實現(xiàn)自定義的卷積神經(jīng)網(wǎng)絡(luò)層不太方便,需要自己實現(xiàn)前向 / 反向傳播算法。Debug(調(diào)試)操作起來也比較麻煩。
“后來使用了 TensorFlow,其基于 dataflow graph(數(shù)據(jù)流向圖)的計算結(jié)構(gòu)對于自定義的深度學習操作很友好,也便于 debug。” 萬鵬飛說,“另外對循環(huán)神經(jīng)網(wǎng)絡(luò)的支持也比較好,大大提高了研發(fā)效率。”
如今,TensorFlow 已經(jīng)被應(yīng)用在美圖旗下產(chǎn)品多個功能的網(wǎng)絡(luò)訓練中,如肢體關(guān)鍵點檢測、五官分析、人像分割、圖像畫質(zhì)增強、天空分割。萬鵬飛對 TensorFlow 評價頗高:“TensorFlow 的分布式訓練能力,大大提高了深度學習網(wǎng)絡(luò)的訓練效率。”
美圖秀秀讓人們變美麗的背后的技術(shù)圖三
萬鵬飛同時還提及 TensorFlow 社區(qū)對 MTlab 的幫助。完善的官方文檔說明、豐富的課程、以及對新手友好的互助氛圍,都吸引著更多開發(fā)者加入 TensorFlow 社區(qū)。
TensorFlow 官方也在努力促進社區(qū)的壯大。在今年的世界人工智能大會上, TensorFlow將舉辦“智在啟無限”主題論壇,邀請國內(nèi)外不同領(lǐng)域,數(shù)十位重量級嘉賓,共同探討機器學習如何在商業(yè)中應(yīng)用,幫助企業(yè)和開發(fā)者解決現(xiàn)實生活的問題:
TensorFlow 全球產(chǎn)品總監(jiān)將深度解析機器學習的內(nèi)核;通用電氣貝克休斯高級總監(jiān)將分享如何確保安全生產(chǎn)、預測組件壽命和系統(tǒng)異常、避免意外停機;網(wǎng)易嚴選算法總監(jiān)將分享如何實現(xiàn)季節(jié)性商品銷量預測、提升用戶點擊、節(jié)約倉儲和供應(yīng)鏈成本;騰訊醫(yī)療大數(shù)據(jù)科學家將分享如何優(yōu)化用戶意圖理解、為醫(yī)院、醫(yī)生和病人提供更優(yōu)質(zhì)的服務(wù)。還有一些前沿的機器學習研究者們也將來到本次論壇,分享機器學習在文化和藝術(shù)領(lǐng)域取得突破的經(jīng)驗。