20150923090751fd65a_550.jpg

 

區(qū)分外形一模一樣的機器方法只需要看編號,但是直接從有機特征來區(qū)分人,這并不容易。就好像至今仍未完工的大教堂“圣家堂”的設計者高更所說,“直線屬于人類,曲線屬于上帝。”——人臉不光是由復雜的曲線所構成,還有毛發(fā)、痣等特征,而且隨著年齡的成長、閱歷的變化,人臉也會發(fā)生細微的變化。

不過,如果要機器/機器人在未來給特定的、不同的人提供服務,記住并認出一個人的臉是首要的事情,畢竟沒有人愿意在和機器人聊天之前,還要輸入一長串自己記不住的密碼。

今年 5 月成功融資 4700 萬美元 Face++ 是人臉識別領域倍受矚目的新創(chuàng)公司。它所提供的技術服務,被糅合進多款億級用戶量的產品當中,包括支付寶的“刷臉支付”,美圖系一系列產品(美圖手機、美圖秀秀、美顏相機),Camera360,世紀佳緣。

不僅如此,F(xiàn)ace++ 還被中信銀行、江蘇銀行、網(wǎng)商銀行、積木盒子、拍拍貸、小米金融等金融公司采用,來驗證客戶的身份。

機器人認出人臉,之后?

2014 年上半年,F(xiàn)ace++ 連續(xù)在 3 個世界技術比賽獲得排名第一的成績,顯示出團隊雄厚的技術實力,包括:

人臉檢測(在照片中精準定位人臉位置的算法),在世界公開評測集 FDDB 排名第一;

人臉關鍵點檢測(精準定位面部關鍵部門的位置),在世界公開評測比賽 300-W 排名第一;

在最重要的互聯(lián)網(wǎng)圖片人臉識別(Face recognition)比賽 LFW 中,F(xiàn)ace++ 團隊更是力壓 Facebook 人臉識別團隊(前被 Facebook 用 6000 萬美元收購的 face.com 團隊),獲得世界第一。在極難識別的互聯(lián)網(wǎng)新聞圖片上,獲得了97.3%的準確率。

印奇對愛范兒說,臉部識別歸類可為兩個大場景,“一個叫做靜態(tài)的人臉識別,一個叫動態(tài)的人臉識別,靜態(tài)的意思就說基本上是基于一張照片,和一個數(shù)據(jù)庫來去做人臉這種識別和比對……第二個動態(tài),基本上意思是說,基本上在這種視頻這種監(jiān)控的視頻里,然后可能在人這種可能在運動的情況下,對它進行人臉的抓拍和識別。”

第一種靜態(tài)人臉識別的技術成熟度已經(jīng)很高,F(xiàn)ace++ 的合作伙伴大部分基于這個類型,一個是識別人的臉部特征,從而實現(xiàn)精準的調整。比如在和美圖系產品合作的時候,F(xiàn)ace++ 就提供人臉檢測、人臉追蹤、關鍵點檢測技術,讓 app 可以精確定位人臉當中需要美化的部分。

二是實現(xiàn)身份的識別。2013 年世紀佳緣使用 Face++ 的技術,推出“最佳伴侶”通過人臉識別技術對網(wǎng)站的人臉數(shù)據(jù)庫進行分析、精準配對,讓世紀佳緣的會員可以相互匹配。因為在該方面技術成熟,F(xiàn)ace++ 的技術還應用了支付寶的“刷臉支付”,以及各個金融公司的身份驗證環(huán)節(jié)當中。

然而,在動態(tài)人臉識別方面,因為技術挑戰(zhàn)難度更大,目前只達到相對可商用化的程度。印奇用解釋了這方面的挑戰(zhàn),“從視頻監(jiān)控角度來看,有一類叫‘通道式’,比如放在機場安全門上的監(jiān)控攝像頭,它可以抓拍到大部分人的正面,所以它的動態(tài)人臉識別難度不高,可以只識別高質量的正面照片。不過,如果是在火車站這種開放式的場景下,動態(tài)的人臉識別的難度就很高了,一是分辨率低,二是角度千變萬化,識別系統(tǒng)需要一套多張的照片結合 3D 建模和識別的方法來提高人臉識別的精度。”

印奇認為,F(xiàn)ace++ 的發(fā)展有兩個比較重要的里程碑,一是 2012 年將“臉部識別云平臺”將這個概念產品化;二是在今年將臉部識別與金融行業(yè)的應用結合起來,“相當于將從一個比較泛的平臺到一個可以被落地的場景化產品”。他透露,今年 Q4 Face++ 將發(fā)布幾個新產品,預計也是團隊的下一個里程碑。

Face++ 已經(jīng)和中信銀行、江蘇銀行、網(wǎng)商銀行、積木盒子、拍拍貸、小米金融等金融公司達成合作,將臉部識別技術融合進他們的產品當中。印奇解釋,金融公司將臉部識別當成高效、安全的驗證手段,廣泛運用在銀行的各個業(yè)務里,包括柜面的輔助驗證、以及高額放貸等等。

深度學習才是核心

Face++ 聯(lián)合創(chuàng)始人印奇說,“臉部識別是一件很難的事情。”

人的容貌會隨著環(huán)境的變化而變化,而且還會自己打扮自己,或者說隨著時間而變化,胖子變成瘦子,瘦子變成胖子,這些因素夾雜在一起,會令臉部識別的難度變高。所以,臉部識別的真正興起和深度學習的發(fā)展有深度的關聯(lián)。這也是團隊從成立開始一直著重的發(fā)展方向。

“深度學習是一個非常依賴于數(shù)據(jù)的技術”,印奇說,“在早期我們做人臉識別的時候,數(shù)據(jù)來源不足,因此內部開發(fā)許多數(shù)據(jù)系統(tǒng),通過互聯(lián)網(wǎng)的手段去爬取、標注大量有效的數(shù)據(jù)。所以我們其實相當于一步一步從前到后推演,開發(fā)一個很復雜的工具來解決前置性的問題?,F(xiàn)在我們底層基礎建設做好了,技術研發(fā)就相對順利。”

“盡管中間遇到一些困難,但在遇到困難的時候,團隊的士氣反而高昂,大家都是喜歡挑戰(zhàn)的聰明人,另外我本人比較好勝,在遇到困難的時候,會更加注意激發(fā)團隊的潛力。”

——如果說人臉識別是一種“招式”,那么“深度學習”可視為一門“心法”。當 Face++ 團隊在深度學習上深耕的同時,他們也可以將這個技術應用在更多的方面。印奇說,“Face++ 是我們團隊推出的第一款產品,我們母公司叫曠世科技,專注與計算機視覺、圖像識別這個大方向?,F(xiàn)在計算機視覺有一個概念叫‘云 + 端’,云端是智能化的識別引擎,而在端的方面,各種新興的傳感器、包括更好的攝像頭等等,我覺得有非常大的機會。”

三個創(chuàng)始人的創(chuàng)業(yè)理想

實際上,曠世科技的三名創(chuàng)始人都是清華大學姚期智實驗班的同學。印奇在大二的時候就在微軟亞洲研究院做計算機視覺相關的研究工作。一年之后,印奇準備出國讀博士,在那個時候他與另外兩名創(chuàng)始人創(chuàng)立了一家公司繼續(xù)深耕計算機視覺領域。不過,印奇與其他兩名創(chuàng)始人討論,“做未來的機器視覺,就相當于我們?yōu)闄C器打造一雙眼睛,那么可能光靠算法和軟件部分的技術知識是不夠的,同時要懂這個眼睛的這些硬件和光學相關的東西。”

后來印奇到哥倫比亞大學讀博士,導師是相機設計領域是一名權威。不過 2 年后因為公司發(fā)展到了比較重要的階段,他輟學回國創(chuàng)業(yè)。

如今 Face++ 的公司戰(zhàn)略的制定,得益于印奇在哥大培養(yǎng)了對計算機視覺領域整體脈絡的把握。另外,在哥大,他也學習到了如何將一個產品說出一個好故事的能力,“在國外來說,其實如果講好一個故事是相當于,是你能夠真能理清這一個技術或者產品它未來其實最核心的特征,它的應用,它的需求,也能把這個東西用一個非常好的形式能表達給大家,所謂創(chuàng)業(yè)方面,這樣的思考的緯度和加上能力很重要。”

當臉部識別技術發(fā)展成熟,未來會有更多的想象空間。印奇對愛范兒說,“互聯(lián)網(wǎng)之前應用的人臉識別更多是娛樂化的應用,現(xiàn)在特別剛性的需求還沒有出現(xiàn),我在想也許未來可能會有些比較好的這種產品的這種應用的產品,所以我現(xiàn)在看到比較大的機會,在于大的傳統(tǒng)領域,金融領域,社保領域,安防領域,從這些領域里面,未來一到兩年的時間里存在爆發(fā)點。當然在未來,比如說能跟一些像無人機這種出來的智能機器人都結合,大家一定相信這是個未來更大的方向,但是具體的應用場景,我覺得需要我們去和這些新興的這種設備的廠商去共同的去研發(fā)。”

最后,作為一名創(chuàng)業(yè)者,印奇有句話希望分享,“創(chuàng)業(yè)的過程是很美好的,但是我覺得適合創(chuàng)業(yè)的人并沒有那么多,所以大家一定要想清楚自己為什么要創(chuàng)業(yè),或者為什么能創(chuàng)業(yè),想清楚了再去做。”


智能界(m.jwnfls.cn)是中國首家專注于報道智能科技前沿的綜合垂直媒體,秉承“引領未來智能生活”的理念,持續(xù)關注智能家居、可穿戴設備、智能醫(yī)療、機器人、3D打印、智駕等諸多科技前沿領域,提供最前沿、最時尚、最實用、最專業(yè)的硬件產品介紹、硬件評測、服務定制、最新資訊、圈子交流等服務,致力于成為最具價值的智能科技信息互動平臺。

智能界【微信公眾號ID:znjchina】【新浪/騰訊微博:@智能界】

人已收藏

相關文章

評論列表(已有條評論)

最新評論