【導(dǎo)讀】iPhone X的全面屏設(shè)計,蘋果在該手機上取消了實體Home鍵,并且用Face ID人臉識別取代了以往Touch ID指紋識別。據(jù)稱此方法比 TouchID 更安全,誤差率低至 1:1,000,000。
什么是Face ID?
蘋果公司在iPhone X中使用了“TrueDepth攝像機系統(tǒng)”(也就是“齊劉海”部分),通過使用里面的傳感器和點陣投影儀,投射出3萬多個點,就能形成一張完整的3D“臉譜”用來識別用戶臉部。據(jù)悉, iPhone X采用定制的芯片來處理人工智能工作負載,這是一個雙核的“ A11生物神經(jīng)網(wǎng)絡(luò)引擎”芯片,每秒運算次數(shù)最高可達6000億次,該芯片賦能的最重要的事情就是使Face ID身份認證功能能夠快速識別人臉。同時,經(jīng)過不斷被訓(xùn)練的神經(jīng)網(wǎng)絡(luò)建模識別人臉,當(dāng)你的iPhone X識別你的臉部次數(shù)越多,它就會對你越熟悉。不管你是換發(fā)型、留胡子、戴帽子、戴眼鏡,還是光線強弱不同,它都會認出你。
同為生物識別技術(shù),TouchID的解鎖錯誤率是五萬分之一,而FaceID則是一百萬分之一,
iPhoneX人臉識別功能主要靠劉海部位的原深感攝像頭實現(xiàn),主要包括距離感應(yīng)器、泛光感應(yīng)元件、點陣投影儀和紅外鏡頭。雖然iPhone X實際進行人臉識別的過程非常復(fù)雜,不過可以簡化成以下幾個步驟:
1、檢測物體靠近:當(dāng)各位拿起手機時,首先工作的是距離感應(yīng)器,它將會告訴iPhone X是否有物體進行靠近;
2、檢測用戶臉部:泛光感應(yīng)元件采用垂直腔面發(fā)射激光器(VCSEL),POPPUR只要大家知道它會發(fā)射低功率紅外光就可以了。在距離感應(yīng)器檢測到物體后,泛光感應(yīng)元件就會對前方物體進行掃描,由紅外鏡頭接收信息,并傳給A11芯片神經(jīng)網(wǎng)絡(luò)系統(tǒng)進行判斷,識別為臉部后再進行下一步操作。
3、獲取3D人臉信息:雖然檢測到是人臉,但是泛光感應(yīng)元件發(fā)出的只是簡單紅外光,并不能記錄空間信息,這時候點陣投影器發(fā)射的高功率紅外結(jié)構(gòu)光就派上用場了。結(jié)構(gòu)光一般指呈條紋狀或者點陣狀的特殊光線,這種光線在打到凹凸不平的物體表面時會造成圖像扭曲,從而獲得物體的空間深度信息。
4、結(jié)構(gòu)光接收:用于人臉識別的光線對精度要求比較高,不僅點陣投影儀發(fā)射的點要足夠多(三萬多個),同時還要防止環(huán)境光干擾,因此紅外鏡頭上還搭載濾光片,除了特定頻率的紅外光都會被剔除掉(為了保證感應(yīng)能力和避免太陽光的干擾,一般選擇800~900nm波長附近的近紅外光)。
5、收集完結(jié)構(gòu)光等信息后,手機通過3D圖像處理芯片可以生成具備空間信息的三維圖像。這些信息將會經(jīng)過特殊調(diào)制,以數(shù)據(jù)形式與保存在處理器的Secure Enclave的Face ID編碼(注冊Face ID時錄入的信息,無法被提取到手機外或者被傳到云端)進行配對,匹配度滿足蘋果設(shè)置的要求后手機就能實現(xiàn)解鎖。
事實上,近幾年來以來,業(yè)界對于臉部識別的應(yīng)用“屢試不爽”,但一直因為安全問題被詬病。比如只需要通過一張電腦所有者的照片,就可以輕松進入設(shè)置了臉部識別登錄方式的電腦;再比如流行科學(xué)作家丹·莫倫(Dan Moren)通過一個視頻就擊敗了阿里巴巴的面部識別系統(tǒng)。
蘋果的FaceID,采用的是結(jié)構(gòu)光雙攝方案,通過將3萬多個光點的網(wǎng)絡(luò)投射到人臉上,并隨著用戶轉(zhuǎn)動頭部以映射臉部3D形狀,最終形成的是一個三維圖像,這也是目前安全性最高的人臉識別方案。而其它技術(shù)更多還是二維人臉解鎖的方案。
Face ID安全嗎?
蘋果iPhone X的面部識別功能中包含“注意力檢測”功能,這個功能可以確認你是在清醒的狀態(tài)下使用手機。因此當(dāng)你睡覺時,有人試圖解鎖你手機的行為將會失敗。
“注意力檢測”原理為人眼視線檢測,檢測用戶視線方向,判斷用戶的注視區(qū)域,系眼球追蹤技術(shù)的一部分。這部分功能同樣是由“齊劉海”硬件實現(xiàn)(蘋果收購的眼動追蹤企業(yè)SMI為技術(shù)提供方),利用紅外鏡頭和泛光感應(yīng)元件,實現(xiàn)人眼瞳孔的特征定位,在通過AI芯片A11的深度學(xué)習(xí)估算人眼視線方向。
在操作應(yīng)用上其中涉及的公開專利原理摘要為,一種方法包括接收計算機化系統(tǒng)的用戶的身體至少一部分的三維(3D)映射序列,并從3D映射中提取用戶頭部的3D坐標(biāo) ?;陬^部的3D坐標(biāo),識別由用戶執(zhí)行的注視方向以及在耦合到計算機化系統(tǒng)的顯示器上,在注視方向上呈現(xiàn)的交互項目。從3D映射中提取指示;指示用戶正在特定方向上移動身體的肢體,并且響應(yīng)于該指示,將所識別的交互項目重新定位在顯示器上。
這項于2016年12月份公開的專利,即是注意力檢查的原理,將上圖的PC機及攝像設(shè)備想象縮小到手機端,用戶只有在眼睛注意力集中在一個圓圈中,同時它會要求用戶將頭部放在同一個圓圈中。這一步驟同時完成人臉圖像掃描,以及注視點映射。
當(dāng)今視線檢測技術(shù)的精度可以達到1°以下,一些多年從事眼動分析的技術(shù)公司可以做到0.4°的高精度。按照1°的偏差精度來計算,當(dāng)用戶注視iPhone X手機屏幕圓圈時,視線偏差距離不超過5mm。因此,通過“注意力檢測”技術(shù),當(dāng)人眼的關(guān)注視線落在手機屏幕上時,F(xiàn)ace ID認為此時用戶傳達了交互的目的,即進行解鎖。而在用戶視線偏離手機屏幕時,“注意力檢測”結(jié)果將幫助Face ID不要誤解鎖手機。
Face ID會失效嗎?
Face ID為滿足不同時段不同環(huán)境對攝像頭的要求,如白天、黑夜、室內(nèi)、室外。攝像頭會使用紅外光(泛光感應(yīng)元件)照亮你的臉,使用紅外鏡頭捕捉圖像。以下是人臉識別的具體步驟:
1、首先,把IR圖像從相機發(fā)送到iPhone X的神經(jīng)引擎里,以構(gòu)建用戶的人臉3D模型
2、將用戶的3D模型或“驗證圖像”在計算機算法中呈現(xiàn),并將其與用戶存儲的模板或“設(shè)置圖像”進行比較;
3、根據(jù)這兩個圖像之間的相似度得出對比數(shù)值,看驗證圖像和設(shè)置圖像是否匹配;
4、如果對比數(shù)值高于某個確定數(shù)值,iPhone X會通過你的身份驗證并解鎖。
因此,F(xiàn)ace ID是否會失效要看蘋果對于閾值的設(shè)定,如果設(shè)定較高的閾值,相應(yīng)失效問題就會小很多。
2D人臉識別技術(shù)與3D人臉識別技術(shù)
對于刷臉消費、刷臉解鎖這些“黑科技”,人們其實一點都不陌生,但如果要深入其中,普通人也只能說出一個關(guān)鍵詞:人臉識別。而人臉識別技術(shù)實際上可以區(qū)分為2D和3D兩種。
1、2D人臉識別:2D人臉識別是目前最為常見的人臉識別技術(shù)之一,其工作原理是后期人臉識別系統(tǒng)對圖片中的人臉進識別,通過設(shè)定數(shù)百或數(shù)千個點,并記錄點與點之間的函數(shù),該函數(shù)即為此人的面部信息。
2、3D人臉識別: 3D人臉識別是采用3D結(jié)構(gòu)光技術(shù),通過3D結(jié)構(gòu)光內(nèi)的數(shù)萬個光線點對人臉進行掃描后,從而提供更為精確的面部信息,而這類面部信息并不會受到口紅、粉底等化妝品的影響。與2D人臉識別相比,3D人臉識別將提供更為精確的面部數(shù)據(jù),最終讓數(shù)據(jù)更加安全可靠。
“普通視覺傳感設(shè)備讓萬物看到世界,而3D傳感技術(shù)則讓萬物能像人一樣‘看清’世界。”
3D傳感技術(shù)原理
要談3D傳感技術(shù),就必須先弄清楚光學(xué)測量分類以及其原理。
光學(xué)測量分為主動測距法和被動測距法。主動測距方法的基本思想是利用特定的、人為控制光源和聲源對物體目標(biāo)進行照射,根據(jù)物體表面的反射特性及光學(xué)、聲學(xué)特性來獲取目標(biāo)的三維信息。其特點是具有較高的測距精度、抗干擾能力和實時性,具有代表性的主動測距方法有結(jié)構(gòu)光法、飛行時間法、和三角測距法。
主動測距法
結(jié)構(gòu)光法
根據(jù)投影光束形態(tài)的不同,結(jié)構(gòu)光法又可分為光點式結(jié)構(gòu)光法、光條式結(jié)構(gòu)光法和光面式結(jié)構(gòu)光法等。
目前應(yīng)用中較廣,且在深度測量中具有明顯優(yōu)勢的方法是面結(jié)構(gòu)光測量法。面結(jié)構(gòu)光測量將各種模式的面結(jié)構(gòu)投影到被測物體上,例如將分布較密集的均勻光柵投影到被測物體上面,由于被測物體表面凹凸不平,具有不同的深度,所以表面反射回來的光柵條紋會隨著表面不同的深度發(fā)生畸變,這個過程可以看作是由物體表面的深度信息對光柵的條紋進行調(diào)制。所以被測物體的表面信息也就被調(diào)制在反射回來的光柵之中。通過被測物體反射回來的光柵與參考光柵之間的幾何關(guān)系,分析得到每一個被測點之間的高度差和深度信息。
結(jié)構(gòu)光的優(yōu)點是計算簡單,測量精度較高,對于平坦的、無明顯紋理和形狀變化的表面區(qū)域都可進行精密的測量。其缺點是對設(shè)備和外界光線要求高,造價昂貴。目前,結(jié)構(gòu)光法主要應(yīng)用在條件良好的室內(nèi)。
飛行時間法(ToF)
飛行時間(Time of Flight,簡稱ToF)法,又叫做激光雷達(LiDAR)測距法。它將脈沖激光信號投射到物體表面,反射信號沿幾乎相同路徑反向傳至接收器,利用發(fā)射和接收脈沖激光信號的時間差可實現(xiàn)被測量表面每個像素的距離測量。
ToF直接利用光傳播特性,不需要進行灰度圖像的獲取與分析,因此距離的獲取不受物體表面性質(zhì)的影響,可快速準確地獲取景物表面完整的三維信息。缺點則是需要較復(fù)雜的光電設(shè)備,價格偏貴。
三角測距法
三角測距法又稱主動三角法,是基于光學(xué)三角原理,根據(jù)光源、物體和檢測器三者之間的幾何成像關(guān)系來確定空間物體各點的三維坐標(biāo)。在實際測量過程中,它常用激光作為光源,用CCD相機作為檢測器。這種方式主要用于工業(yè)勘探、工件表面粗糙度檢測、輪胎檢測、飛機檢測等工業(yè)、航空、軍事領(lǐng)域,在消費電子類產(chǎn)品還不曾涉及。
被動測距法
被動測距技術(shù)不需要人為地設(shè)置輻射源,只利用場景在自然光照下的二維圖像來重建景物的三維信息,具有適應(yīng)性強、實現(xiàn)手段靈活、造價低的優(yōu)點。但是這種方法是用低維信號來計算高維信號的,所以其使用的算法復(fù)雜。被動測距按照使用的視覺傳感器數(shù)量可分為單目視覺、雙目立體視覺和多目視覺三大類。
單目視覺
單目視覺是指僅利用一臺照相機拍攝一張相片來進行測量。因僅需要一臺相機,所以該方法的優(yōu)點是結(jié)構(gòu)簡單、相機標(biāo)定容易,同時還避免了立體視覺的小視場問題和匹配困難問題。
單目視覺方法又可分聚焦法和離焦法兩類。聚焦法是指首先使相機相對于被測點處于聚焦位置,然后根據(jù)透鏡成像公式求得被測點相對于相機的距離。相機偏離聚焦位置會帶來測量誤差,因此尋求精確的聚焦位置是關(guān)鍵所在。而離焦法不要求相機相對于被測點處于聚焦位置,而是根據(jù)標(biāo)定出的離焦模型計算被測點相對于相機的距離,這樣就避免了由于尋求精確的聚焦位置而降低測量效率的問題,但離焦模型的準確標(biāo)定是該方法的主要難點。
雙目立體視覺
雙目立體視覺的基本原理是從兩個視點觀察同一景物,以獲取在不同視角下的感知圖像,然后通過三角測量原理計算圖像像素間的位置偏差(視差)來獲取景物的三維信息。這一過程與人類視覺感知過程是類似的。
在雙目立體視覺系統(tǒng)的硬件結(jié)構(gòu)中,通常采用兩個攝像機作為視覺信號的采集設(shè)備,通過雙輸入通道圖像采集卡與計算機連接,把攝像機采集到的模擬信號經(jīng)過采樣、濾波、強化、模數(shù)轉(zhuǎn)換,最終向計算機提供圖像數(shù)據(jù)。一個完整的雙目立體視覺系統(tǒng)通常可分為數(shù)字圖像采集、相機標(biāo)定、圖像預(yù)處理與特征提取、圖像校正、立體匹配、三維重建六大部分。
多目立體視覺
多目立體視覺系統(tǒng)是對雙目視覺系統(tǒng)的一種拓展。所謂多目立體視覺系統(tǒng),就是采用多個攝像機設(shè)置于多個視點,或者由一個攝像機從多個視點觀測三維景物的視覺系統(tǒng)。
對多目系統(tǒng)所采集到的景物圖像進行感知、識別和理解的技術(shù)被稱為多目立體視覺系統(tǒng)技術(shù)。在雙目立體視覺中,對于給定的物體距離,視差與基線長度成正比,基線越長,對距離的計算越精確。但是當(dāng)基線過長時,需要在相對較大的視覺范圍內(nèi)進行搜索,從而增加計算量。利用多基線立體匹配是消除誤匹配、提高視差測量準確性的有效方法之?;€數(shù)目的增加可以通過增加相機來實現(xiàn)。
光電3D影像技術(shù)
根據(jù)獲取圖像信息方法的不同,光電3D影像技術(shù)分為有源和無源兩種技術(shù),無源技術(shù)主要是接受物體的輻射或者環(huán)境的發(fā)射,有源技術(shù)是通過投射一束調(diào)制的或未調(diào)制的光到物體上通過檢測物體反射的光來形成3D圖像。
以前大多數(shù)技術(shù)研究集中在無源3D技術(shù)上,利用三角測量原理,通過兩臺相距一定距離的照相機,左邊照相機產(chǎn)生的圖像表示深度信息,右邊照相機產(chǎn)生差異的二維圖像。關(guān)鍵是產(chǎn)生深度信息的照相機需要分離出深度信息。無源3D影像技術(shù)需要拍攝的物體具有突出的輪廓特點,比如邊緣、角、線等。其優(yōu)點是不需要特殊的硬件條件,并成功使用在好幾個方面。這種技術(shù)的缺點是需要兩臺或者更多的高質(zhì)量的照相機、圖像處理軟件。圖像質(zhì)量、拍照速度、數(shù)據(jù)傳輸?shù)榷际沁@種機制能否被廣泛應(yīng)用的限制因素。
有源3D光電圖像方法是投射一束有規(guī)律的空間分布的線狀光到物體上從而產(chǎn)生一個網(wǎng)狀格的深度。廣泛使用的有源光方法是飛行時間(time off light)方法,最近幾年,市場上出現(xiàn)的3D照相機都是基于飛行時間方法,這些3D照相機主要應(yīng)用于工業(yè)控制,通過飛行時間方法檢測相位來實現(xiàn)3D影像。一束幾十兆赫茲被調(diào)制的近紅外光照射到物體上,物體反射的光進入3D照相機,由于立體物體的遠近距離不同,反射光的相位存在一個延遲,通過檢測原始光束以及反射光束的相位延遲從而檢測出物體的景深,從而實現(xiàn)3D圖像。這種3D圖像傳感器的制作由ZMD公司完成,ZMD公司根據(jù)3D圖像傳感器需要高速的特點從噪聲和速度進行工藝優(yōu)化,響應(yīng)速度可以到100MHz以上。
3D傳感技術(shù)的應(yīng)用
其實,除了用于手機的人臉識別,3D傳感技術(shù)已經(jīng)應(yīng)用到了很多方面,在2018中國互聯(lián)網(wǎng)大會上,有國人廠家推出的智慧家庭新生態(tài)解決方案,賦予電視3D人臉識別、精準內(nèi)容推薦、手勢交互等創(chuàng)新功能,顛覆智慧家庭客廳體驗。通過3D人臉識別技術(shù),電視可在不獲取用戶隱私的前提下,精準識別出機頂盒前的觀眾的用戶畫像信息,包括性別、年齡、情緒等等。同時,系統(tǒng)根據(jù)登錄的用戶角色信息,通過綜合統(tǒng)計分析該用戶角色的行為數(shù)據(jù),可為用戶提供“千人千面”的個性化EPG界面,精準推薦電視節(jié)目、視頻點播、游戲應(yīng)用等內(nèi)容。
此外,3D傳感技術(shù)可以賦能各行各業(yè):首先是機器人廠商,尤其是服務(wù)性機器人的眼睛需要3D視覺技術(shù),去感知周邊的環(huán)境,例如目標(biāo)距離、障礙物等信息;其次是安防廠商,在傳統(tǒng)的安防攝像頭里面再加裝一個視覺傳感器,就可以獲得一個更加精準的三維立體信息;還有門禁門鎖,3D的刷臉識別相比2D的刷臉識別,安全等級和精準性可以提升一級;最后,就手機行業(yè)的發(fā)展趨勢來說,3D傳感技術(shù)未來的應(yīng)用空間很大,刷臉等生物識別都離不開3D傳感技術(shù),此外VR、AR、美顏也可以搭載3D傳感技術(shù)去做一些交互性、娛樂性的體驗。還有各種各樣的智能硬件,凡是需要采集物體深度信息的相關(guān)功能,都會用到3D傳感技術(shù)。
推薦閱讀: