智東西(公眾號:zhidxcom) 文 | 四月 導(dǎo)語:去年,馬云刷臉在淘寶上買下漢諾威展郵票,“刷臉場景”火遍大江南北。實際上,除了金融支付,當(dāng)單位門禁、課堂考勤識別從指紋換成人臉時,人臉識別類應(yīng)用已經(jīng)被頻繁應(yīng)用。未來,分散在各地的攝像頭連接成一個有機(jī)的巨大“天網(wǎng)”,“刷臉”應(yīng)用將成為下一代重要的交互模式。 人臉識別,類屬視覺模式的一個細(xì)分領(lǐng)域,成為繼智能語音后的又一塊技術(shù)熱點。不限于好萊塢科技電影中炫酷的“天眼”掃描場景,人臉識別技術(shù)已經(jīng)滲透到多類日常。去年,馬云刷自己的臉在淘寶上買下漢諾威展郵票,“刷臉場景”火遍大江南北。實際上,除了金融支付,當(dāng)單位門禁、課堂考勤識別從指紋換成人臉時,人臉識別類應(yīng)用已經(jīng)被頻繁應(yīng)用。 一、攝像頭代替“人眼” 所謂“計算機(jī)視覺”,即讓計算機(jī)模仿人的雙眼,完成相關(guān)任務(wù)和指令。如獲得物體信息,識別有意義的概念、與此前知識體系匹配,進(jìn)行判斷和解讀。這一系列看似簡單的任務(wù),對機(jī)器來說卻并不那么容易實現(xiàn)。 要完成人臉識別的工作,首先需要進(jìn)行準(zhǔn)確的“人臉檢測”,即計算機(jī)在圖像或視頻中找到人臉的位置,只需要判斷目標(biāo)圖像是不是人臉。例如當(dāng)前大部分照相機(jī),及手機(jī)攝像頭都有人臉檢測功能,可以自動獲得人臉位置,從而對圖片作一些自動調(diào)焦和優(yōu)化。 隨后,計算機(jī)會針對圖像的具體信息進(jìn)行提取,包括人臉部件點定位,人臉圖像的對齊和歸一化,人臉圖像質(zhì)量選取,特征提取,特征比對等。此時,可以對人臉進(jìn)行一些身份信息判讀,包括性別、年齡,甚至顏值。 值得強(qiáng)調(diào)的是,在金融支付與身份驗證場景中,多將人臉檢測作為輔助性手段,使用者往往需要提前出示自己的身份。這是一種“1:1”的身份驗證,計算機(jī)對當(dāng)前人臉和庫存人臉進(jìn)行比對,是對其他驗證方式的一種輔助,從而提高身份驗證的可靠性。 但在一些偵查類戲劇作品中,警察通過聯(lián)機(jī)查保存了所有通緝犯數(shù)據(jù)的人臉庫,將所獲取的通緝犯信息放到通緝犯數(shù)據(jù)庫中去逐個比對,以獲取匹配度最高的嫌疑犯。每次人臉識別計算機(jī)要作n次人臉比對,這就是“1:n”的人臉查找。 如果要求計算機(jī)只憑人臉識別出一個人的身份,就是最常見的“1:n”模式,其目標(biāo)人臉庫由n個人臉組成,隨著n的增大,準(zhǔn)確識別的難度也會增大,一次識別所需要的計算時間也會增加。一個普通的人能對數(shù)十量級上進(jìn)行判斷人臉的準(zhǔn)確識別,隨著n的增加,計算機(jī)識別的優(yōu)勢得到凸顯。 人臉識別技術(shù)的比較維度很多,除了常見1:1,1:n比對級,還包括n:n,其衡量的標(biāo)準(zhǔn)不同。單從精確度上看,國內(nèi)外視覺識別技術(shù)公司的識別正確率差異多體現(xiàn)在小數(shù)點上,比較意義不大。商業(yè)適用性則成為更加最關(guān)鍵的強(qiáng)化方向,以及實際使用場景中的準(zhǔn)確率和可靠性。 二、初創(chuàng)和巨頭的不同玩法 目前國內(nèi)人工智能方向的創(chuàng)業(yè)公司約200家左右,其中一半獲得了投資,超過70%的公司主攻圖像或語音識別兩個分類,其中部分人臉識別水平可比肩甚至超過美國。諸如Face++、Sensetime等初創(chuàng)公司,正在不遺余力地引進(jìn)尖端人才方面。包括漢王、大恒、奧普光電等上市公司已經(jīng)在B端市場的安防、工業(yè)制造領(lǐng)域占據(jù)領(lǐng)先份額。 計算機(jī)視覺已成為人工智能板塊最受投資青睞的領(lǐng)域。 據(jù)數(shù)據(jù)網(wǎng)站顯示,國內(nèi)計算機(jī)視覺領(lǐng)域公司約30家,其中完成融資的公司接近80%。換個說法,凡是公司的業(yè)務(wù)與技術(shù)以計算機(jī)視覺應(yīng)用為主,那么被投資的概率就是80%。這樣的資本青睞程度放到整個互聯(lián)網(wǎng)圈都是十分可怕的。 另一方面,相比于小規(guī)模創(chuàng)業(yè)者的做法,擁有海量數(shù)據(jù)與龐大業(yè)務(wù)規(guī)模的互聯(lián)網(wǎng)巨頭們開始了從內(nèi)向外的創(chuàng)新和布局。騰訊在內(nèi)部組建了人臉識別團(tuán)隊優(yōu)圖實驗室。百度人臉識別也依靠龐大的數(shù)據(jù)資源得到指數(shù)級積累,阿里巴巴控股某人臉識別企業(yè),將結(jié)合自家平臺人臉數(shù)據(jù)優(yōu)勢,推動人臉識別2C的發(fā)展。 但此類公司對機(jī)器視覺產(chǎn)業(yè)的開發(fā)主要還是集中在工具化方面,例如騰訊的鑒黃服務(wù)、百度的識圖功能等,主要應(yīng)用在自有的產(chǎn)品體系中。 視覺嘗試盈利模式、換取利潤的同時,也積累了大量的底層影像和圖片數(shù)據(jù)。圖片數(shù)據(jù)支持著相關(guān)技術(shù)算法的優(yōu)化,在機(jī)器視覺技術(shù)越來越先進(jìn)的同時,也將會滲透到更多的場景當(dāng)中去,例如電商的圖片檢索、機(jī)器人模塊植入等。 巨頭和初創(chuàng)們在起跑線擺出了火拼的架勢,商業(yè)大戰(zhàn)前的硝煙味在彌漫。 三、滲透進(jìn)不同場景 目前,人臉識別技術(shù)重點應(yīng)用的領(lǐng)域是安防和金融。前不久,科大訊飛在年度會議上推出的“曉曼機(jī)器人”,可替代銀行柜臺人員完成交易,稱明年三月產(chǎn)品將落地。 據(jù)統(tǒng)計,國內(nèi)至少已有多家銀行開始試水人臉識別技術(shù),不用帶卡就可以從ATM機(jī)上“刷臉”取款。比較早的有招商銀行、上海銀行。另外,中國銀聯(lián)也聯(lián)手Linkface打造人臉識別互聯(lián)網(wǎng)+金融支付新產(chǎn)品,并試點于徽商銀行。此外還在以下領(lǐng)域得到應(yīng)用。 布局金融人臉識別的大佬已排滿,看看其他領(lǐng)域還可分杯羹嗎? 1)身份驗證 今年十一月滴滴引入了人臉識別技術(shù),以此來提高安全系數(shù)。據(jù)悉,滴滴順風(fēng)車新車主首次接單前需通過人臉識別系統(tǒng)審核后才能在平臺接單,以防止私換司機(jī)等違規(guī)行為,保障乘客安全。 順風(fēng)車系統(tǒng)會要求車主通過搖頭、眨眼等動作進(jìn)行人像采集,并將車主上傳的面部信息及其注冊時使用的證件信息與公安部數(shù)據(jù)庫進(jìn)行比對,成功后才能正式接單。而采用人臉識別技術(shù)是為了保證司機(jī)注冊賬戶和本人信息相符。 2)公共安全 在旅客進(jìn)行正常的安檢工作的同時,人臉識別系統(tǒng)會自動將旅客證件照片與之核對,識別旅客身份,其準(zhǔn)確率遠(yuǎn)高于人眼識別,即使旅客換了發(fā)型、化了濃妝也沒關(guān)系。 國家網(wǎng)絡(luò)安全宣傳周上獲悉,目前“人臉識別技術(shù)”已經(jīng)用于反恐活動中,該技術(shù)為動態(tài)識別,每秒鐘能夠識別5-8個人的身份。今年6月份已在廣州地鐵站進(jìn)行試點。 此外,人臉識別門禁應(yīng)用也在萬科、金地、廣州越秀、四川藍(lán)光等智慧小區(qū)落地。通過人臉識別對訪客、外來人員、周邊服務(wù)人員起到良好的管理作用,并提升O2O服務(wù)水平和保障。 3)娛樂社交 微軟曾推出刷臉應(yīng)用 ——“微軟我們”(TwinsOrNot.net),只需任意上傳兩張人物照片,就可以知道他們長的有多像,比如,測試你是否和某個明星長得很像,或者夫妻/男女朋友是不是有夫妻相等。 How-Old.net風(fēng)靡全球,它們都很巧妙地將人臉辨認(rèn)與社交網(wǎng)絡(luò)中的人際交往結(jié)合在一起,年齡、性別、顏值、測測就知道。 時拍照貼臉錄像的娛樂性app–臉優(yōu)。臉優(yōu)是利用人臉多個特征點,實時完成“貼臉”的功能。 4)物件簽收 今年十月,中國郵政與騰訊達(dá)成全面戰(zhàn)略合作,EMS將充分利用微信公眾號與手機(jī)QQ平臺,實現(xiàn)’預(yù)約-寄件-支付-查詢-收件’的自有平臺一站式服務(wù)。 據(jù)介紹,未來騰訊優(yōu)圖人臉識別技術(shù)也將廣泛應(yīng)用于EMS的政務(wù)、貴重物品和重要文書快遞中。這也意味著,以后去取快遞可以直接“刷臉”。 四、待填滿的市場缺口 現(xiàn)在不管是國際、國內(nèi),針對人臉識別還沒有(行業(yè))標(biāo)準(zhǔn),處于比較混沌的早期狀態(tài),具有實力的公司在未來還有很大機(jī)會脫穎而出。 人臉識別技術(shù)在使用方式上,辨識方便性上,留存現(xiàn)場使用者人像照片上均有非常明顯的優(yōu)勢,在ImageNet等國際測試中準(zhǔn)確率不斷被刷新,但在實際場景的應(yīng)用中還存在些許的發(fā)展瓶頸。 第一,視頻傳感設(shè)備的制約。人臉識別技術(shù)成像必須依靠攝像頭采集深度信息,常采用紅外光和可見光兩種方案。 對于近紅外技術(shù)而言,人臉識別的攝像頭模組需專門的模組提升辨識精度,勢必降低其攝像頭的兼容性;而可見光技術(shù),理論上任何普通攝像頭均可使用,但是當(dāng)前攝像頭行業(yè)中在視頻清晰度、光線適應(yīng)性上缺乏明確標(biāo)準(zhǔn),聚焦方式和聚焦能力也各不相同。 在一定程度上,攝像頭本身的發(fā)展速度,制約著人臉識別技術(shù)的拓展以及普及性,也勢必制約大市場的爆發(fā)和使用的辨識效率。 第二,由于軟件開發(fā)以及各種半導(dǎo)體零部件占據(jù)了絕大多數(shù)成本,而其中較為核心的零部件還需要進(jìn)口、底層軟件開發(fā)方面在國內(nèi)更是存在大量市場空白。 第三,易受到光照,角度,人臉部的裝飾物等各種因素的影響。這也不難解釋為什么人臉識別技術(shù)目前還沒有大量應(yīng)用在日常生活中,大部分人只能在科幻電影中接觸人臉識別了。 第四,活體識別。能區(qū)分真人和照片的技術(shù),這個研究領(lǐng)域叫l(wèi)iveness detection,中文叫做“活體取證”。 因為現(xiàn)在社交網(wǎng)絡(luò)、電子成像產(chǎn)品很發(fā)達(dá),人們可以很方便獲取他人的人臉照片,進(jìn)而來欺騙人臉識別系統(tǒng),所以區(qū)分系統(tǒng)前的人臉是真的人臉,還是照片/視頻/三維面具,就變得非常重要。 對于照片欺騙,主要是根據(jù)分辨率(翻拍的照片分辨率比直接從真人上采集的照片在質(zhì)量、分辨率上有差別)、三維信息、眼動等來區(qū)分。對于視頻欺騙,根據(jù)三維信息、光線等來區(qū)分。對于三維面具欺騙,這方面的研究還很少(實際欺騙場景也相對較少)。 計算機(jī)算法是可以區(qū)分照片和真人的。但是人臉活體取證在實際應(yīng)用中,還有很大局限性?,F(xiàn)在的算法基本還是基于實驗室數(shù)據(jù),離實用存在一段距離。 另外,在指紋、虹膜等模式識別上也面臨這個問題。 五、結(jié)語 歷經(jīng)兩起兩落,人工智能技術(shù)在第三次高潮的推動下初見落地之勢?;谏疃葘W(xué)習(xí)神經(jīng)網(wǎng)絡(luò)算法在語音和視覺識別上的進(jìn)展,識別率分別超過了99%和95%,感知智能時代已經(jīng)逼近。最初在工業(yè)領(lǐng)域應(yīng)用的機(jī)器視覺,逐步在日常生活場景中得到落地,從平面的圖像識別向含有深度信息的人臉和其他模式識別過渡。 但據(jù)業(yè)內(nèi)人士透露,國內(nèi)人臉識別廠商在核心算法上擁有自主知識產(chǎn)權(quán)的極少,大部分國內(nèi)外的人臉識別技術(shù)多數(shù)在OpenCV等開源庫上進(jìn)行新規(guī)則添加,或使用其它公司的收費(fèi)SDK等。并且該領(lǐng)域的創(chuàng)業(yè)公司整體規(guī)模仍較少,從側(cè)面也反映出其技術(shù)門檻和對口人才稀缺。 從總體上來看,從機(jī)器視覺產(chǎn)業(yè)的構(gòu)成來看,視覺處理軟件、鏡頭、工業(yè)相繼、圖像處理單元、圖像采集卡都是必不可少的幾個環(huán)節(jié)。未來,視覺識別技術(shù)公司對于芯片和模塊廠商的支持需求旺盛,雙方將走得更近,另外,創(chuàng)業(yè)公司的產(chǎn)品在擴(kuò)寬渠道和領(lǐng)域時會偏更向消費(fèi)者市場,如機(jī)器人和無人機(jī)等產(chǎn)品。上周,鴻海集團(tuán)旗下子公司FOXTEQ HOLDINGS 參投了Face++ 2000萬美元投資,不無與富士康投資的Pepper合作可能。 從產(chǎn)業(yè)鏈上發(fā)力,創(chuàng)業(yè)公司可能尋找到更多的投資機(jī)會。 |
|
來自: 水針智客 > 《社會財經(jīng)》