- 多媒體中視頻應(yīng)用的編碼特征
- 多媒體中視頻應(yīng)用的負(fù)載特性分析
- SOC系統(tǒng)增加了一個(gè)功率控制模塊(PCM)
- 采用反饋機(jī)制來控制功率
在SOC設(shè)計(jì)中,設(shè)計(jì)者大量重用現(xiàn)有經(jīng)過驗(yàn)證的成熟IP核,對(duì)于設(shè)計(jì)一個(gè)復(fù)雜系統(tǒng)并保證其上市時(shí)間的意義重大。當(dāng)前,很多專業(yè)的IP供應(yīng)商提供了大量可供設(shè)計(jì)者選用的IP核,設(shè)計(jì)者們需要根據(jù)應(yīng)用需求,選出合適的IP核,并確定每種IP核對(duì)應(yīng)的配置。對(duì)于移動(dòng)多媒體SOC的設(shè)計(jì),為了實(shí)現(xiàn)系統(tǒng)級(jí)的優(yōu)化,SOC系統(tǒng)設(shè)計(jì)者的核心目標(biāo)之一即是在保證多媒體服務(wù)質(zhì)量的同時(shí)使得系統(tǒng)代價(jià)(芯片面積和功耗)最小化。
本文對(duì)多媒體中視頻應(yīng)用的編碼特征以及負(fù)載特性進(jìn)行分析,從系統(tǒng)設(shè)計(jì)及優(yōu)化的層次,將功率管理模塊嵌入至多媒體SOC系統(tǒng)中。同時(shí),將系統(tǒng)的運(yùn)行狀態(tài)按不同的IP配置情況組合成一系列微狀態(tài),在前人所做工作的基礎(chǔ)上,利用F-ARIMA模型預(yù)測(cè)負(fù)載,同時(shí)利用多媒體應(yīng)用中衡量服務(wù)質(zhì)量的重要指標(biāo)——最后期限缺失率(deadlinemissrate,DMR)作為反饋控制信息,兩者相結(jié)合的方式,實(shí)時(shí)調(diào)整多媒體SOC系統(tǒng)的運(yùn)行狀態(tài),實(shí)現(xiàn)移動(dòng)多媒體SOC設(shè)計(jì)過程中的功耗優(yōu)化。
常用視頻編碼標(biāo)準(zhǔn)以及負(fù)載分析
在所有的視頻壓縮算法中,MPEG-x和H.26y標(biāo)準(zhǔn)正逐漸占據(jù)主導(dǎo)地位。這些視頻壓縮算法,帶來更高傳輸效率的同時(shí),也帶來了終端更大的運(yùn)算量。根據(jù)多媒體應(yīng)用的特征及其編碼標(biāo)準(zhǔn),不難發(fā)現(xiàn),并非所有多媒體視頻幀所需要的解碼時(shí)間都是一致的。以MPEG標(biāo)準(zhǔn)壓縮的幀為例,其總共由三種類型的幀構(gòu)成,分別為:內(nèi)部幀(intra),雙向幀(bidirectional)和可預(yù)測(cè)幀(predictive)。這三種不同類型的幀,具有不同的解碼復(fù)雜度。即使是同一種類型的幀內(nèi)部,其解碼復(fù)雜度也有較大差異。顯而易見,將所有的解碼任務(wù)的實(shí)時(shí)性約束都設(shè)置為同一個(gè)標(biāo)準(zhǔn)將會(huì)導(dǎo)致系統(tǒng)始終工作于最差分支下,從而付出不必要的功耗開銷。
目前,在多媒體SOC設(shè)計(jì)過程中,針對(duì)其重要的視頻應(yīng)用的負(fù)載特性進(jìn)行功耗優(yōu)化是一個(gè)非常熱點(diǎn)的研究問題。常見的低功耗設(shè)計(jì)技巧主要有動(dòng)態(tài)電壓調(diào)整(dynamicvoltagescale,DVS)和動(dòng)態(tài)功率管理(dynamicpowermanagement,DPM)技術(shù)。在DVS技術(shù)中,在保證服務(wù)質(zhì)量的同時(shí),讓不同計(jì)算量的任務(wù)運(yùn)行在不同的工作電壓和頻率;而DPM技術(shù)則在運(yùn)行過程中,動(dòng)態(tài)關(guān)閉系統(tǒng)某些空閑模塊。在眾多針對(duì)多媒體應(yīng)用進(jìn)行低功耗設(shè)計(jì)的研究中,其主要思路可分為兩類。一種是將多媒體應(yīng)用的負(fù)載當(dāng)作一個(gè)隨機(jī)過程,然后采用馬爾可夫或者半馬爾可夫模型預(yù)測(cè)負(fù)載,再根據(jù)預(yù)測(cè)結(jié)果調(diào)整當(dāng)前系統(tǒng)運(yùn)行狀態(tài)。如在文中,提出了一種基于回歸方程的方式,通過系統(tǒng)當(dāng)前“工作”和“空閑”時(shí)間預(yù)測(cè)即將到來的“工作”和“空閑”時(shí)間。分別利用離散馬爾可夫時(shí)間序列和連續(xù)馬爾可夫序列算法預(yù)測(cè)系統(tǒng)負(fù)載。以上這些方式都有效地降低了系統(tǒng)功耗開銷,但是其最大不足之處在于多媒體應(yīng)用的編碼方式和內(nèi)容多種多樣,無法找到一種合適的模型來適應(yīng)所有多媒體應(yīng)用。另外一方面,也有研究利用實(shí)時(shí)反饋控制的方式,來調(diào)整當(dāng)前系統(tǒng)運(yùn)行狀態(tài)的方式來降低多媒體系統(tǒng)的功耗。
目前,使用最廣泛的視頻壓縮標(biāo)準(zhǔn)為MPEG-x(x=1,2,4)系列和H.26y,(y=1,2,3,4)系列。一般地,視頻編碼器將連續(xù)的圖像壓縮成I,B,P三種不同的幀類型。I幀的壓縮率大于P幀,P幀的壓縮率大于B幀。連續(xù)的兩個(gè)I幀之間的所有幀(不包括后一個(gè)I幀)構(gòu)成一個(gè)圖像分組(GOP)。一個(gè)GOP由I幀幀間間隔N,以及P幀幀間間隔M兩個(gè)參數(shù)決定。與此對(duì)應(yīng),對(duì)于解碼器的解碼負(fù)載而言則有I>P>B這個(gè)規(guī)律。
即便采用同一種編碼格式,面向不同的應(yīng)用場(chǎng)景,多媒體應(yīng)用的負(fù)載情況也有很大區(qū)別,下面以H.264.視頻壓縮標(biāo)準(zhǔn)為例,給出一些常見格式的視頻應(yīng)用的負(fù)載情況,見表1。
[page]
根據(jù)表1的實(shí)驗(yàn)結(jié)果,圖l將更形象地描述解碼器的工作過程。從圖1中可以看出,解碼器僅有兩種狀態(tài),即高速工作狀態(tài)和空閑狀態(tài)。由于解碼器運(yùn)行狀態(tài)下的能量消耗計(jì)算方式為
式中:T為工作時(shí)間;C是與系統(tǒng)負(fù)載電容相關(guān)的系數(shù);Vdd和f分別為供電電壓和運(yùn)行頻率。對(duì)于同樣的負(fù)載,根據(jù)式(1),很容易推導(dǎo)出,當(dāng)負(fù)載均勻分布于時(shí)間間隔T內(nèi)時(shí),能量效率是最優(yōu)的。所以,對(duì)于面向多媒體應(yīng)用的SOC低功耗系統(tǒng)級(jí)優(yōu)化而言,其主要思想就是如何根據(jù)具體應(yīng)用的需要,在當(dāng)前可用的IP及其配置中,尋求一套最優(yōu)化的組合,使得系統(tǒng)負(fù)載能均勻分布在給定的時(shí)間約束內(nèi)。圖2給出的則是設(shè)計(jì)者進(jìn)行系統(tǒng)級(jí)功耗優(yōu)化的理想狀態(tài),雖然在實(shí)際應(yīng)用中該狀態(tài)永遠(yuǎn)無法達(dá)到,但是可以在設(shè)計(jì)過程中無限逼近這一狀態(tài)。
2系統(tǒng)實(shí)現(xiàn)
在多媒體SOC中,為了保證服務(wù)質(zhì)量,系統(tǒng)的設(shè)計(jì)目標(biāo)必須是面向最高負(fù)載情況。然而在實(shí)際運(yùn)行過程中,視頻解碼器、中央處理器以及一些外設(shè)經(jīng)常處于不活動(dòng)或者低負(fù)載狀態(tài),這無疑白白消耗了一些能量。為解決該問題,EDA公司對(duì)Multi-Vt以及Muhi-Vdd等低功耗設(shè)計(jì)技術(shù)提供更有力的支持,IP供應(yīng)商對(duì)同一IP核也提供了豐富配置以滿足不同應(yīng)用需求,同時(shí)Foundry也提供了更豐富的標(biāo)準(zhǔn)單元庫以及工藝。在進(jìn)行低功耗多媒體SOC設(shè)計(jì)的過程中,設(shè)計(jì)者所要做的就是充分利用這些技術(shù)優(yōu)勢(shì),盡可能地去開發(fā)可利用的低功耗設(shè)計(jì)空間。
圖3給出了一個(gè)多媒體SOC目標(biāo)系統(tǒng)的基本架構(gòu)圖,該系統(tǒng)和當(dāng)前多媒體SOC系統(tǒng)最大的差異在于增加了一個(gè)功率控制模塊(PCM)。該模塊的實(shí)現(xiàn)方式可以靈活多樣,對(duì)于某些對(duì)實(shí)時(shí)性要求較高的功能塊(如負(fù)載預(yù)測(cè)),可以采用硬件加速的方式實(shí)現(xiàn)。而對(duì)于實(shí)時(shí)性要求不高的功能塊,則可以利用中央處理器的軟件資源來實(shí)現(xiàn)。在設(shè)計(jì)過程中,先將構(gòu)成系統(tǒng)的各個(gè)IP核按其配置和對(duì)應(yīng)的性能,同時(shí)結(jié)合多媒體SOC的應(yīng)用需求,組合成一系列的微狀態(tài),然后將這些狀態(tài)構(gòu)成一個(gè)查找表,存儲(chǔ)于功率控制模塊。
系統(tǒng)在運(yùn)行過程中,控制模塊會(huì)根據(jù)當(dāng)前負(fù)載情況,實(shí)時(shí)調(diào)整整個(gè)系統(tǒng)的運(yùn)行狀態(tài),通過配置寄存器的方式,讓系統(tǒng)在各個(gè)不同微狀態(tài)之間切換,從而盡量使負(fù)載能均勻分布于整個(gè)運(yùn)行過程中,達(dá)到降低功耗的目的。在功率控制模塊的核心算法中,本文采用了反饋控制和負(fù)載預(yù)測(cè)相結(jié)合的方式,以此來彌補(bǔ)彼此的不足之處。對(duì)于負(fù)載預(yù)測(cè)而言,預(yù)測(cè)模型的準(zhǔn)確性直接關(guān)系到多媒體的服務(wù)質(zhì)量。研究表明,多媒體視頻幀長(zhǎng)的統(tǒng)計(jì)特征表現(xiàn)出了很強(qiáng)的長(zhǎng)相關(guān)性(longtermdependency,IRD),而多媒體SOC的系統(tǒng)負(fù)載又和幀長(zhǎng)有著直接關(guān)系,所以在功率控制模塊中,采用F-ARIMA模型來進(jìn)行負(fù)載預(yù)測(cè)。該模型是一種典型的自相似模型,能很好地反映時(shí)間序列的LRD特性,從而能比較準(zhǔn)確地進(jìn)行多媒體視頻應(yīng)用的負(fù)載預(yù)測(cè)。
而對(duì)于反饋控制機(jī)制,本文采用了跟視頻服務(wù)質(zhì)量密切相關(guān)的最后期限缺失率(DMR)作為反饋標(biāo)準(zhǔn)。具體方法是:首先系統(tǒng)運(yùn)行于缺省狀態(tài),通常是性能相應(yīng)功耗都最高的狀態(tài)。然后系統(tǒng)根據(jù)性能檢測(cè)模塊,并從預(yù)測(cè)模型庫中選擇預(yù)測(cè)模型對(duì)負(fù)載進(jìn)行預(yù)測(cè),然后根據(jù)預(yù)測(cè)結(jié)果實(shí)時(shí)調(diào)整當(dāng)前系統(tǒng)的微狀態(tài)。當(dāng)系統(tǒng)性能檢測(cè)模塊監(jiān)測(cè)到DMR高于某一預(yù)先設(shè)定的門限,則系統(tǒng)反饋控制模塊負(fù)責(zé)調(diào)整預(yù)測(cè)模型的參數(shù)或者徹底更新預(yù)測(cè)模型,直至DMR值低于預(yù)先設(shè)定的門限值。
本文針對(duì)移動(dòng)多媒體SOC設(shè)計(jì)中的功耗問題,提出了一種系統(tǒng)級(jí)低功耗設(shè)計(jì)方法。該方法的核心是利用各種IP所提供的配置空間,將多媒體SOC系統(tǒng)細(xì)分為不同的微狀態(tài)。同時(shí)結(jié)合傳統(tǒng)的DVS以及DPM思想,利用反饋控制和負(fù)載預(yù)測(cè)相結(jié)合的方式,實(shí)時(shí)調(diào)整系統(tǒng)運(yùn)行過程中的微狀態(tài),從而在保證多媒體服務(wù)質(zhì)量的基礎(chǔ)上,讓系統(tǒng)負(fù)載盡可能均勻分布于整個(gè)運(yùn)行期間,達(dá)到降低功耗的目的。通過系統(tǒng)級(jí)的仿真和評(píng)估,該算法相對(duì)傳統(tǒng)方法而言,進(jìn)一步有效地降低了系統(tǒng)功耗,平均約能降低40%左右。同時(shí),由于該方法采用了與服務(wù)質(zhì)量直接相關(guān)的DMR作為反饋控制信號(hào),故在降低功耗的同時(shí),能保證多媒體視頻DMR在9%以下,均值在5%以下。