【導(dǎo)讀】強(qiáng)大的電腦芯片、高效的紅外LED以及新型的攝像傳感器,讓先前復(fù)雜的眼動(dòng)追蹤系統(tǒng)如今能夠適應(yīng)消費(fèi)類電子應(yīng)用的各種需要。借助這些系統(tǒng),電子設(shè)備可以檢測(cè)用戶的眼球運(yùn)動(dòng),從而識(shí)別用戶的下一步意圖。結(jié)合現(xiàn)有的輸入方法,眼動(dòng)追蹤開(kāi)啟了豐富的直觀人機(jī)交互新體驗(yàn)。
幾十年來(lái),鍵盤和鼠標(biāo)一直是我們操控電腦的傳統(tǒng)工具。隨著智能手機(jī)、平板電腦等移動(dòng)設(shè)備的誕生,人們需要借助新技術(shù)來(lái)與這類沒(méi)有配備鍵盤和鼠標(biāo)的微型計(jì)算機(jī)進(jìn)行有效交流。由此,觸摸屏成為了一項(xiàng)關(guān)鍵技術(shù),使得這些電子產(chǎn)品更加友好。而語(yǔ)音識(shí)別技術(shù)的加入,則使其更為直觀。
先知先覺(jué)的設(shè)備
隨著物聯(lián)網(wǎng)的普及,我們需要交互的電子設(shè)備的數(shù)量也將與日俱增。智能家居便是一個(gè)典型示例,聲控恒溫器已開(kāi)始運(yùn)用其中。未來(lái),我們還可以直接與機(jī)器人進(jìn)行交互。除交互式工業(yè)機(jī)器人之外,家庭助理機(jī)器人和醫(yī)療助理機(jī)器人也在研發(fā)當(dāng)中。而今,設(shè)備可以通過(guò)觸摸屏接收指令,也可以通過(guò)內(nèi)置式耳機(jī)收聽(tīng)指令。借助眼動(dòng)追蹤系統(tǒng),它們還能檢測(cè)到用戶正在注視的對(duì)象,從而預(yù)測(cè)用戶的下一步意圖。這將為直觀的人機(jī)交互開(kāi)啟無(wú)限可能。
在很多領(lǐng)域,眼動(dòng)追蹤的硬件條件已然具備
眼動(dòng)追蹤系統(tǒng)可以檢測(cè)人的眼球運(yùn)動(dòng)以及注視方向。起初,人們開(kāi)發(fā)眼動(dòng)追蹤系統(tǒng)是出于市場(chǎng)調(diào)研、行為分析和合用性研究的目的。此外,在幫助那些雙手無(wú)法操作電腦的用戶方面,它們的應(yīng)用已有一段時(shí)間。其中許多系統(tǒng)使用紅外光照射用戶眼睛,并通過(guò)攝像機(jī)獲取圖像,然后根據(jù)圖像數(shù)據(jù)計(jì)算眼球運(yùn)動(dòng)。因此,這些系統(tǒng)需要特制的高質(zhì)量攝像機(jī)、光源和軟件,有時(shí)還需要加裝硬件加速器來(lái)處理海量的圖像數(shù)據(jù)。
而今天,借助極其強(qiáng)大的芯片、緊湊型攝像傳感器和新型的大功率LED,可以將眼動(dòng)追蹤功能集成到智能手機(jī)等電子設(shè)備上。其實(shí),許多電子設(shè)備上都搭載了攝像傳感器和紅外光源,只不過(guò)它們是用來(lái)實(shí)現(xiàn)面部識(shí)別、虹膜識(shí)別等其他功能。因此,接下來(lái)需要有的就是一款合適的軟件,來(lái)將眼動(dòng)追蹤作為一個(gè)附加功能加以集成。
發(fā)展現(xiàn)狀
目前,各個(gè)領(lǐng)域均在開(kāi)發(fā)各種創(chuàng)新概念,意在促進(jìn)眼動(dòng)追蹤用作一種新型的人機(jī)接口。在具有眼動(dòng)追蹤功能的智能手機(jī)和平板電腦的屏幕上,已經(jīng)可以通過(guò)視線接觸激活圖標(biāo)或移動(dòng)游戲人物。具有眼動(dòng)追蹤功能的游戲電腦能使玩家在游戲場(chǎng)景中更為身臨其境。在一些系統(tǒng)中,玩家可以通過(guò)眼球動(dòng)作控制游戲人物的視角,而無(wú)需使用鼠標(biāo)或觸控板。眼動(dòng)追蹤同樣也可以用于常規(guī)電腦,如通過(guò)眼球動(dòng)作實(shí)現(xiàn)文檔滾動(dòng)查看。
此外,在智能家居行業(yè),有多種方式可以通過(guò)眼動(dòng)追蹤技術(shù)與各種設(shè)備進(jìn)行交互。例如,具有眼動(dòng)追蹤功能的智能電視已經(jīng)問(wèn)世。汽車領(lǐng)域也已提出這些系統(tǒng)的潛在應(yīng)用,其中的一個(gè)典型示例便是駕駛員活動(dòng)助理系統(tǒng),它可以監(jiān)測(cè)駕駛員的眼球活動(dòng),從而及時(shí)檢測(cè)到疲勞駕駛的信號(hào)。眼動(dòng)追蹤功能也可以用于監(jiān)測(cè)駕駛員的注視方向,從而確定其正專注前方路況還是注意力分散。這類信息將有助于避免道路上出現(xiàn)緊急情況。
圖1:視線接觸激活圖標(biāo)。眼動(dòng)追蹤結(jié)合現(xiàn)有的輸入功能,開(kāi)啟了全新的電子設(shè)備操控方式。
消費(fèi)類電子產(chǎn)業(yè)的眼動(dòng)追蹤系統(tǒng)
上述應(yīng)用中的新型眼動(dòng)追蹤系統(tǒng)基于紅外LED(IRED)和高分辨率攝像傳感器而設(shè)計(jì),它們分別用于照射人眼和記錄眼球反射的光線。然后,由圖像處理算法根據(jù)這些原始數(shù)據(jù)計(jì)算瞳孔的位置(圖2),再由專用軟件利用屏幕等參照物的位置信息確定用戶所注視的具體位置。不管眼睛是什么顏色,尤其是在黑暗中或屏幕背光非常明亮?xí)r,紅外照明均可以確保虹膜與瞳孔之間所需的對(duì)比度。
圖2:眼動(dòng)追蹤系統(tǒng)使用紅外光照射人眼,并利用攝像傳感器捕捉圖像。所捕捉的圖像數(shù)據(jù)用于確定瞳孔的位置,并用來(lái)計(jì)算用戶注視的方向。
這些系統(tǒng)目前的最遠(yuǎn)探測(cè)距離是一米。智能手機(jī)和平板電腦的工作距離通常在30cm左右,而臺(tái)式電腦則通常在60cm左右。屏幕分辨率與眼睛的光柵尺寸相對(duì)應(yīng),平板電腦約為1cm,電腦則約為2cm。所用紅外LED的數(shù)量以及發(fā)射器和攝像頭的具體排列取決于應(yīng)用的類型,即工作距離的長(zhǎng)短和覆蓋面積的大小。此外,設(shè)置還會(huì)因所采用的眼動(dòng)追蹤軟件而有所不同,這是因?yàn)閹缀卧O(shè)計(jì)也要看各種算法能否可靠地檢測(cè)瞳孔的轉(zhuǎn)向。一般而言,發(fā)射器和攝像傳感器需要按特定角度進(jìn)行布局,彼此之間需保持一定距離,以避免收到眼鏡的眩光或者光線從眼球到傳感器的直接反射。距離越大,信號(hào)質(zhì)量越好,用戶與設(shè)備間最佳距離的選擇空間就越靈活。。
用于眼動(dòng)追蹤系統(tǒng)的紅外LED
不同于大多數(shù)需要使用特定波長(zhǎng)的虹膜掃描儀,眼動(dòng)追蹤系統(tǒng)可以在較寬的光譜范圍內(nèi)運(yùn)行。通常,這些系統(tǒng)需要借助現(xiàn)有的虹膜掃描或面部識(shí)別系統(tǒng),并搭配波長(zhǎng)為850nm或810nm的IRED。人眼可感知到波長(zhǎng)為850nm的IRED所發(fā)出的微弱紅外光。許多眼動(dòng)追蹤解決方案制造商更傾向于采用940nm的IRED,因?yàn)槁阊劭床坏竭@種光。然而,940nm設(shè)計(jì)現(xiàn)在還存在弊端:目前通用的攝像傳感器針對(duì)可見(jiàn)光進(jìn)行了優(yōu)化,但在紅外光譜范圍內(nèi)靈敏度則較低。波長(zhǎng)為940nm時(shí),靈敏度降低十分明顯(圖3),因此需要增強(qiáng)紅外照射,以達(dá)到與850nm光源一樣的信號(hào)強(qiáng)度。鑒于紅外照明的廣泛應(yīng)用,攝像頭制造商正在研發(fā)紅外靈敏度高的新版本。
圖3:在850nm和940nm之間時(shí),針對(duì)可見(jiàn)光優(yōu)化過(guò)的標(biāo)準(zhǔn)攝像傳感器的靈敏度大幅度下降。配備940nm IRED的眼動(dòng)追蹤系統(tǒng)的優(yōu)勢(shì)在于它幾乎不會(huì)被人眼所感知。大多數(shù)情況下,需要使用更高的工作電流來(lái)補(bǔ)償下降的信號(hào)水平。
理想狀態(tài)下,雙眼應(yīng)位于攝像傳感器的捕捉區(qū)域內(nèi)。整個(gè)眼球需被均勻照射,這一點(diǎn)很重要。所需紅外光照射強(qiáng)度取決于工作距離,即便對(duì)于移動(dòng)設(shè)備,也可能需要數(shù)瓦的功率。為盡量減少大工作電流下的熱輸出,發(fā)射器是在脈沖模式下工作。盡管如此,熱管理仍是設(shè)計(jì)重點(diǎn)之一,在更輕薄的智能手機(jī)和平板電腦中尤為如此。因此,IRED效率是除光輸出外的另一個(gè)重要因素。效率越高,產(chǎn)生的熱就越少。
針對(duì)這類應(yīng)用,歐司朗特別開(kāi)發(fā)了Oslon Black系列產(chǎn)品,其中,SFH 4715A的光電效率達(dá)到創(chuàng)紀(jì)錄的48%。這款850nm發(fā)射器在1A工作電流下的典型光輸出為770mW,是目前此工作電流下效率最高的IRED。如果需要,還可以采用納米堆疊技術(shù),在一顆芯片上提供兩個(gè)發(fā)射中心,堆疊布置,從而獲得更高的輸出。工作電流為1A時(shí),SFH 4715AS的典型光輸出為1340mW。它提供90度和150度發(fā)射角兩種版本,涵蓋許多不同的設(shè)計(jì)。Oslon Black版本在1A工作電流下光輸出為990mW,是理想的940nm光源。
圖4:Oslon Black SFH 4715AS的波長(zhǎng)為850nm,是迄今為止功率最大的IRED。工作電流為1A時(shí),其發(fā)光功率為1340mW。得益于其纖薄的外形,其不僅能安裝在最新的智能手機(jī)中,還可以用于下一代設(shè)備。
Oslon Black的一個(gè)特性是其器件高度僅為2.3mm,因此它不僅適用于今天的智能手機(jī),也適用于下一代更為纖薄的電子設(shè)備。
像其他紅外光源應(yīng)用一樣,眼動(dòng)追蹤系統(tǒng)必須符合人眼安全標(biāo)準(zhǔn)。普通用戶接觸的紅外輻射量相對(duì)較低。然而,技術(shù)人員近距離觀看紅外光源時(shí)需留意風(fēng)險(xiǎn)。眼動(dòng)追蹤系統(tǒng)上關(guān)聯(lián)有一個(gè)接近傳感器,可確保在這種情況下IRED能自動(dòng)關(guān)閉。有關(guān)光學(xué)系統(tǒng)安全設(shè)計(jì)的詳細(xì)信息,可參閱《歐司朗人眼安全應(yīng)用注釋》等文獻(xiàn)。
我們周圍有太多復(fù)雜的電子設(shè)備,需要有新的技術(shù)來(lái)實(shí)現(xiàn)直觀的人機(jī)交互。紅外照明和攝像傳感器為交互技術(shù)奠定了良好的基礎(chǔ),使設(shè)備能“看到”用戶并理解他們的意圖。眼動(dòng)追蹤示例展示了如何在硬件基礎(chǔ)上通過(guò)軟件方案實(shí)現(xiàn)新的交互類型。硬件組件的創(chuàng)新也正驅(qū)動(dòng)著這一發(fā)展。例如,采用波長(zhǎng)為940nm的光源便是其中一種發(fā)展趨勢(shì)。因此,歐司朗也在不斷擴(kuò)展在人臉識(shí)別、眼動(dòng)追蹤等應(yīng)用方面的產(chǎn)品組合。
本文轉(zhuǎn)載自電子技術(shù)設(shè)計(jì),作者:Christoph Goeltner,歐司朗(OSRAM)光電半導(dǎo)體產(chǎn)品經(jīng)理。
推薦閱讀: