【導(dǎo)讀】3月6日,在“AI in 5G——引領(lǐng)新時代論壇”上,人工智能產(chǎn)業(yè)發(fā)展聯(lián)盟(AIIA)正式發(fā)布“AIIA DNN benchmark V0.5”首輪評估結(jié)果。
3月6日,在“AI in 5G——引領(lǐng)新時代論壇”上,人工智能產(chǎn)業(yè)發(fā)展聯(lián)盟(AIIA)正式發(fā)布“AIIA DNN benchmark V0.5”首輪評估結(jié)果。該評估在AIIA權(quán)威測試平臺完成,基于端側(cè)推斷任務(wù)的深度神經(jīng)網(wǎng)絡(luò)處理器基準測試。在四大典型應(yīng)用場景下,能夠客觀反映具有深度學(xué)習(xí)處理能力的處理器或加速器的性能水平。評估結(jié)果顯示,海思麒麟980和瑞芯微RK3399表現(xiàn)上佳。
“AIIA DNN benchmark V0.5”評估的標準較為嚴苛,包含四大典型場景和兩大類評測指標等,指標包含速度(fps)和算法性能,如top1 、top5、mAP、mIoU、PSNR等。同時,這也是深度學(xué)習(xí)處理器領(lǐng)域首次區(qū)分整型和浮點對比的Benchmark。福州瑞芯微電子的RK3399開發(fā)板展現(xiàn)出搶眼數(shù)據(jù)。
采用28nm工藝的福州瑞芯微電子RK3399開發(fā)板,在評估中展現(xiàn)出超強性能。評估數(shù)據(jù)顯示,在浮點模型不需要定點化重新訓(xùn)練的情況下,int8計算以精度損失最大為1%的代價,達到相對于浮點計算兩倍的性能。
此外,在Interpretation評測中,AIIA第一次嘗試在基準測試中將量化和浮點模型分開評測。而福州瑞芯微電子RK3399開發(fā)板同樣取得多項優(yōu)異數(shù)據(jù),在業(yè)內(nèi)處于前列水平。
值得一提的是,福州瑞芯微電子RK3399開發(fā)板數(shù)據(jù)搶眼的背后,離不開前沿技術(shù)的支持。比如RK3399融入了Tengine,后者是由OPEN AI LAB開發(fā)的一款輕量級模塊化高性能神經(jīng)網(wǎng)絡(luò)推理引擎。Tengine專門針對Arm嵌入式設(shè)備優(yōu)化,且無需依賴第三方庫,可跨平臺使用支持Android、Liunx等。
Tengine支持各類常見卷積神經(jīng)網(wǎng)絡(luò),包括SqueezeNet,MobileNet,AlexNet,ResNet等,支持層融合、8位量化等優(yōu)化策略。通過調(diào)用針對不同CPU微構(gòu)架優(yōu)化的HCL庫,能將Arm CPU的性能充分挖掘出來。而RK3399的Cortex-A72單線程運行移動端常用的MobileNet,一次只需要111ms。
在IoT設(shè)備、智能交互設(shè)備、個人電腦、機器人等人工智能設(shè)備的創(chuàng)新與研發(fā)上,福州瑞芯微電子已經(jīng)在技術(shù)上展現(xiàn)出領(lǐng)先優(yōu)勢,除了RK3399以外,旗艦級人工智能芯片RK3399Pro同樣極具看點,其首次采用CPU+GPU+NPU的硬件結(jié)構(gòu)設(shè)計。這一芯片集成的NPU(神經(jīng)網(wǎng)絡(luò)處理器)融合了福州瑞芯微電子在機器視覺、語音處理、深度學(xué)習(xí)等方面的關(guān)鍵技術(shù),片上NPU運算性能高達3.0TOPs,具備高性能、低功耗、開發(fā)易等優(yōu)勢。
人工智能芯片大變革時代,人工智能產(chǎn)業(yè)發(fā)展聯(lián)盟(AIIA) “AIIA DNN benchmark V0.5”權(quán)威測試平臺的亮相以及首輪數(shù)據(jù)發(fā)布,或?qū)⒔K結(jié)AI芯片缺乏統(tǒng)一數(shù)據(jù)測試標準的局面,加速人工智能芯片的技術(shù)蛻變與進化。