【導讀】在芯原AI專題技術研討會上,芯原高級副總裁、定制芯片平臺事業(yè)部總經理汪志偉表示,“大模型”與AIGC對于算力需求正在不斷升級,這既然體現在云端,也體現在邊緣端和終端:云端訓練主要側重于高性能計算、大數據分析、海量數據存儲,邊緣計算則側重于推理、實施決策和部分數據訓練,終端數據采集則涵蓋原始數據采集、帶AI的智能傳感器、為大模型提供Tokenized的數據輸入。要解決這些從“云”到“端”的算力問題,就需要相應的硬件、相應的芯片。
6月13日,在芯原AI專題技術研討會上,芯原高級副總裁、定制芯片平臺事業(yè)部總經理汪志偉表示,“大模型”與AIGC對于算力需求正在不斷升級,這既然體現在云端,也體現在邊緣端和終端:云端訓練主要側重于高性能計算、大數據分析、海量數據存儲,邊緣計算則側重于推理、實施決策和部分數據訓練,終端數據采集則涵蓋原始數據采集、帶AI的智能傳感器、為大模型提供Tokenized的數據輸入。要解決這些從“云”到“端”的算力問題,就需要相應的硬件、相應的芯片。
芯原IP業(yè)務全球市場領先
芯原是一家能提供從IP到芯片設計、定制芯片一站式服務的完整解決方案的公司,擁有六大類處理器IP儲備(神經網絡NPU、圖形GPU、視頻VPU、音頻/語音DSP、圖象信號ISP、顯示處理IP)所有的這些處理器IP都會在我們設計AIGC相關的芯片里面都會用到。
目前,芯原的IP業(yè)務已經在全球市場處于領先地位,半導體IP收入排名全球第七,License收入排名全球第五。
具體而言,視頻處理器(VCU)市占率排名全球第一,全球前二十大云平臺解決方案提供商中12個采用了芯原的IP;NPU全球累積出貨超1億顆,已被72家客戶用于其128款人工智能芯片中,擁有超過10個市場應用領域;GPGPU在全球搭載出貨量接近20億。
汪志偉解析道,這幾年發(fā)展非常好的NPU、GPGPU直接貢獻到了AI機器人大模型所需的算力芯片和算力應用上;VPU經歷了三年發(fā)展,它既可以進行圖象的“放大、縮小、畫質增強”,也可以成為AIGC生成式視頻與圖象的一部分;數?;爝@一部分,也支持到從250nm~5nm的不同芯片工藝節(jié)點,而且是在各個不同的方向上都有合作。
豐富的流片經驗
為了更好的為AIGC提供IP,就一定需要一個平臺,即芯原的定制芯片服務平臺。每年該平臺幫助客戶設計30顆以上的芯片,全球首批7nm EUV芯片在2018年一次流片成功,已有多顆5nm芯片成功量產與流片。
汪志偉強調,芯原在各種先進工藝節(jié)點都有著豐富的流片與量產經驗,從28nm~5nm有大量的流片與量產的經驗。
持續(xù)迭代的系統(tǒng)級芯片設計平臺
芯原針對系統(tǒng)級芯片的設計平臺SiPaaS已經迭代很多年,i.MX覆蓋前端到后端。而該平臺為云端設計的芯片都與AI和AIGC相關。
“我們的SiPaaS系統(tǒng)設計平臺經過多年不斷演進,每年都有大量芯片基于該平臺進行設計和流片。由于積累了豐富的技術,可以支持不同處理器架構、總線和存儲器。因此,每次設計新一代芯片時,差距都非常小。這也是為什么我們的一次流片成功率能達到90%以上。”汪志偉表示,芯原從前端設計入手,近年來已經擴展到軟件設計,并將完整的軟件SDK交付給客戶。
舉例來說,一家全球性芯片大廠利用SiPaaS設計的轉碼芯片,是全球首批5nm高性能轉碼芯片之一,目前已經應用在數據中心。該芯片搭載了芯原自己的AI引擎,通過AI解碼后的圖像,可以生成新的圖像和視頻內容。
再舉例來說,芯原還為客戶設計了用于數據中心的高算力AIGC芯片,適用于訓練和推理,內核包括多核高性能CPU和芯原高性能GPGPU-AI IP。由于高性能AIGC芯片需要非常龐大的帶寬,這款芯片還搭載了6400Mhz的HBM3。
為滿足數據中心對算力不斷增長的需求,芯原設計了支持Chiplet互聯(lián)的芯片。它可以通過4~6路接口互聯(lián),將4顆以上的芯片拼接在一起。
汪志偉介紹,芯原為客戶設計的芯片面積已經達到六七百平方毫米,已經接近光照極限,很難進一步增大面積,這種情況下Chiplet設計就是解決算力問題的途徑之一。
芯片需要軟件的支持,因此,芯原提供從IP到芯片再到軟件的一站式完整解決方案。通過這套解決方案,能夠充分發(fā)揮硬件性能的完整軟件協(xié)議棧,從底層到中間層,滿足推理和訓練的要求,解決芯片間和板卡間互聯(lián)的通信問題。
通過車規(guī)認證的的設計流程
汽車是邊緣AIGC重要應用場景之一,芯原設計流程早在兩年前就通過了車規(guī)安全認證,目前已經有多個客戶和項目在進行車規(guī)芯片設計。
芯原設計的自動駕駛芯片支持300TOPS~500TOPS算力,能夠在車上運行大模型,實現超高算力。需要強調的是,芯原在設計階段就完成了基礎軟件的開發(fā),如多目標檢測和自動泊車功能。這樣,當客戶收到芯片后,就可以在一個月內使用視覺、AI、傳感器和自動駕駛等車載功能,幫助客戶大大縮短整車的上市時間。
此外,在座艙中,芯原實現了人臉識別、手勢識別和駕駛員狀態(tài)識別等基礎算法和功能,提供基礎算法軟件平臺。對于軟件能力或算法較弱的客戶,這些平臺可以幫助其在基礎上進行優(yōu)化和二次開發(fā),針對自身需求微調算法或模型。
針對智慧出行應用,芯原按照高算力、低功耗、高可靠性要求,設計開發(fā)所需的平臺化的Chiplet方案及相關技術,并提供從Chiplet、Die-to-Die接口、封裝到軟件的整體解決方案。
不止如此,早在2022年4月2日,芯原宣布正式加入UCIe(Universal Chiplet Interconnect Express)產業(yè)聯(lián)盟。
作為中國大陸首批加入該組織的企業(yè),芯原將與UCIe產業(yè)聯(lián)盟其他成員共同致力于UCIe版本規(guī)范和新一代UCIe技術標準的研究與應用,為芯原Chiplet技術和產品的發(fā)展進一步夯實基礎。
為邊緣帶來AIGC
在邊緣計算領域,芯原同樣擁有許多成果。
比如說,客戶設計的AI-ISP目前已經成功流片,并應用于國內一家手機大廠。該芯片從確定到流片僅用9個月時間。
該AI-ISP芯片帶有AI增強功能,算力強勁,可以輕松運行一般的推理任務,能夠提高手機用戶圖像成像質量,獲得更好效果。這也是AIGC的一部分,所有的原始數據和通過AI處理的數據都可以通過手機上傳到云端,作為云端訓練數據的一部分。
在端側比較典型的另一個案例是Open Se Cura項目,這是一個低功耗安全智能傳感芯片,與谷歌合作開發(fā)。
該芯片在端側幫助大模型采集數據,適用于智能門鈴、安全攝像頭和智能圖像處理,還可以用于語音和圖像的喚醒功能。芯原進行了許多數字設計的最佳實踐,從確定到設計完成僅用了七個半月的時間。
免責聲明:本文為轉載文章,轉載此文目的在于傳遞更多信息,版權歸原作者所有。本文所用視頻、圖片、文字如涉及作品版權問題,請聯(lián)系小編進行處理。
推薦閱讀: