一場國產(chǎn)大算力智駕芯片長跑,“后摩智能”要靠存算一體“新道超車”?
在算力需求蓬勃爆發(fā)的時代下,存算一體技術(shù)已逐漸走到落地爆發(fā)前夜。
這項(xiàng)技術(shù)誕生于1969年,彼時馮·諾依曼架構(gòu)正強(qiáng)勢引領(lǐng)著現(xiàn)代計(jì)算機(jī)時代的發(fā)展,是計(jì)算機(jī)發(fā)展“賴以生存”的基本準(zhǔn)則。而存算一體概念的提出,顛覆性地將芯片的計(jì)算單元與存儲單元融合,能夠從根本上解決馮·諾伊曼架構(gòu)計(jì)算與存儲分離潛在的能效瓶頸。
(資料圖片)
但存算一體技術(shù)十分依賴存儲介質(zhì),且早期存儲器和處理器的工藝和性能差距并不明顯,因此在誕生后的數(shù)十年里,存算一體仍是一項(xiàng)實(shí)驗(yàn)室技術(shù)。
直到2018年前后,一面是人工智能應(yīng)用與大數(shù)據(jù)產(chǎn)業(yè)的爆發(fā)性增長,摩爾定律逼近物理極限;一面是新型存儲介質(zhì)等存算技術(shù)實(shí)現(xiàn)突破性進(jìn)展。隨著傳統(tǒng)馮·諾伊曼架構(gòu)的能效瓶頸愈發(fā)突出,存算一體技術(shù)終于有機(jī)會拿到商業(yè)化的入場券,成為后摩爾時代極具潛力的技術(shù)趨勢之一。
在這個背景下,近年來國內(nèi)早有一批公司沿著存算一體的技術(shù)路徑前行。但在現(xiàn)階段,國內(nèi)落地的存算一體芯片多以智能語音等端側(cè)應(yīng)用為主,對算力要求相對較小,若要真正實(shí)現(xiàn)大規(guī)模商業(yè)落地,仍缺少一個在大算力主流場景落地的契機(jī)。
后摩智能則是我國存算一體行業(yè)早期的踐行者之一。從2020年創(chuàng)立之初,后摩智能就瞄準(zhǔn)未來萬物智能時代,通過底層架構(gòu)創(chuàng)新,為行業(yè)提供極致效率的存算一體大算力AI芯片。經(jīng)過兩年多的一路“狂飆”,后摩智能終于交出了第一份答卷。
5月10日下午,后摩智能正式推出首款量產(chǎn)存算一體大算力AI芯片產(chǎn)品——鴻途?H30,具備256T物理算力,典型功耗僅約為35W。“受益于底層架構(gòu)的創(chuàng)新,這應(yīng)該是目前市面上效率最高的大算力智能駕駛芯片。”后摩智能創(chuàng)始人&CEO吳強(qiáng)篤定地說。
沒錯,后摩智能瞄準(zhǔn)萬物智能亮相的第一張王牌,就是一款智能駕駛芯片,劍指自動駕駛市場。
也許在一些人看來,2023年的智駕芯片已處于爭搶上車的關(guān)鍵階段,而此時向市場拋出一款新產(chǎn)品,后摩智能是否抓得住落地窗口?挑戰(zhàn)叢生的行業(yè)環(huán)境,對后摩智能而言,這無疑是一場關(guān)鍵的自駕芯片市場搶位戰(zhàn)。
01. 押寶智駕芯片,后摩鴻途?H30應(yīng)運(yùn)而生
基于存算一體重構(gòu)智能駕駛芯片,是后摩智能面向萬物智能未來的第一階段目標(biāo),亦是早期戰(zhàn)略聚焦方向。
原因無他,需求是最為關(guān)鍵的決定性因素。在吳強(qiáng)看來,人們平均每天將近1/8的時間都是在駕駛場景,智能駕駛無疑將成為未來智能生活最重要的組成部分之一,“智能駕駛的終局是要替代人類駕駛,用傳感器替代眼睛,用各式各樣的算法填補(bǔ)意識與靈魂,而底層智駕芯片則扮演著人類大腦的角色。”他說。
從這一角度看,智駕芯片一定需要無限接近人腦的計(jì)算方式和效率,而存算一體所擁有遠(yuǎn)超傳統(tǒng)芯片架構(gòu)的高計(jì)算效率,這點(diǎn)技術(shù)優(yōu)勢正與未來智駕芯片的關(guān)鍵需求高度吻合。
在這個機(jī)遇下,鴻途?H30芯片應(yīng)運(yùn)而生。
作為后摩智能首款存算一體大算力AI芯片,H30芯片采用12nm制程工藝,在Int8精度下最高物理算力可達(dá)256Tops,典型功耗不超過35W。在相同工藝下,基于傳統(tǒng)架構(gòu)的AI芯片SoC能效比多為2Tops/W,而基于存算一體架構(gòu)的H30 SoC能效比高達(dá)7.3Tops/W,整體具有高計(jì)算效率、低計(jì)算延時、低工藝依賴等特點(diǎn)。
實(shí)際上,H30頗具差異化的特點(diǎn)其實(shí)是底層架構(gòu)創(chuàng)新所帶來的優(yōu)勢。
簡單來說,過去傳統(tǒng)架構(gòu)芯片產(chǎn)品的效率提升多采用算法和芯片的深度耦合,將算法固化到芯片中,這一定程度上損失了芯片的通用性。而基于存算一體技術(shù),H30能夠從底層架構(gòu)進(jìn)行創(chuàng)新,在不損失通用性的情況下,實(shí)現(xiàn)性價比更高的效率提升。
也就是說,盡管H30是一款相對通用的智能駕駛芯片,但它與其他大部分專用智駕芯片相比,不僅實(shí)現(xiàn)了性能和計(jì)算效率翻倍,支持更多算法模型,同時功耗卻只有它們的二分之一。
為了保證H30的核心競爭力,提高產(chǎn)品的易用性、降低客戶遷移門檻并加速落地,后摩智能還基于H30推出了智能駕駛硬件平臺力馭,以及軟件開發(fā)工具鏈后摩大道兩款產(chǎn)品。
其中,力馭平臺作為一款域控制器,主要面向末端物流無人小車、乘用車智能駕駛、車路協(xié)同等場景。其CPU算力為200Kdmips,AI算力為256Tops,支持多傳感器輸入,系統(tǒng)可靠性進(jìn)一步提升。同時,力馭平臺功耗僅為85W,支持靈活散熱方式,便捷部署成本大大降低。
后摩大道則支持Pytorch、TensorFlow、ONNX等主流開源框架,編程兼容CUDA前端語法,并支持SIMD和SIMT兩種編程模型,無侵入式的底層架構(gòu)創(chuàng)新設(shè)計(jì)也使H30更為高效、易用。
綜合來看,力馭平臺和后摩大道兩款產(chǎn)品更多是解決H30的易用性和快速遷移性問題,在這兩款產(chǎn)品的輔助下,H30也將實(shí)現(xiàn)更快速的應(yīng)用落地,從而進(jìn)一步推動大算力智能駕駛場景的普及應(yīng)用。
02. 自動駕駛新戰(zhàn)場下,存算一體的更優(yōu)解法
推出市場,只是一款智駕芯片的開始,等待它的還有漫長且嚴(yán)苛的驗(yàn)證周期。實(shí)際上,2023年亦被稱作國產(chǎn)智駕芯片上車落地的關(guān)鍵之年,而后摩智能選擇在這個節(jié)點(diǎn)推出H30,這一入場時機(jī)不得不引人深思。
“晚嗎?”——難免有一部分人對H30切入市場的時機(jī)產(chǎn)生疑惑,但吳強(qiáng)卻不這么認(rèn)為。他告訴36氪,如果將智駕芯片的市場脈絡(luò)進(jìn)一步細(xì)分,其實(shí)當(dāng)下真正實(shí)現(xiàn)國產(chǎn)替代的只是低算力需求的L1、L2自動駕駛場景,這個賽道早已完成了國產(chǎn)替代從無到有的過程,接下來要走的是從有到優(yōu)的路。
但在L2++新戰(zhàn)場,尤其是幾十T甚至幾百T大算力需求的高級自動駕駛領(lǐng)域,國產(chǎn)替代仍未真正完成從無到有的第一階段,也沒有已經(jīng)實(shí)現(xiàn)大批量落地的大算力芯片產(chǎn)品,國產(chǎn)化選擇仍十分有限。“新戰(zhàn)場玩家格局未定,H30入局為時不晚。”吳強(qiáng)說。
在吳強(qiáng)看來,面對如今的新戰(zhàn)場,本土玩家提高智駕芯片國產(chǎn)化率的破局關(guān)鍵在于兩點(diǎn),一是芯片實(shí)際應(yīng)用性能要迅速達(dá)到國際巨頭的L2++水平;二是軟件供應(yīng)鏈一定要便捷易用,讓客戶實(shí)現(xiàn)快速遷移。
沿著這條玩家蜂擁而至的賽道,吳強(qiáng)自信滿滿,因?yàn)楹竽χ悄苓x擇了一條與眾不同的技術(shù)路線,也就是其最大的技術(shù)底牌——存算一體。實(shí)際上對傳統(tǒng)架構(gòu)來說,存算一體是一個新的、互補(bǔ)的技術(shù)路線,能夠在制造工藝和供應(yīng)鏈安全需求越來越嚴(yán)格的后摩爾時代,實(shí)現(xiàn)獨(dú)特的技術(shù)優(yōu)勢。
隨著AI計(jì)算的不斷演進(jìn),未來大算力AI應(yīng)用將面臨兩個核心問題,一是數(shù)據(jù)帶寬的瓶頸,二是功耗問題。正如前文所說,存算一體能從底層架構(gòu)解決傳統(tǒng)馮·諾伊曼架構(gòu)越來越凸顯的存儲墻問題,打破能效瓶頸。
打個比方,芯片就好比一個巨大的工廠,它在執(zhí)行每一次運(yùn)算任務(wù)時,都需要將數(shù)據(jù)從存儲器搬離,通過總線數(shù)據(jù)傳輸通道運(yùn)送到處理器,待加工完畢后再搬運(yùn)回存儲器。這意味著,芯片的處理速度與總線速度息息相關(guān),一旦需要處理的數(shù)據(jù)量越來越大,計(jì)算效率將會受到制約。
存算一體的核心就是將存儲和計(jì)算緊密結(jié)合,以降低數(shù)據(jù)在兩者之間頻繁搬運(yùn)導(dǎo)致的能耗和延遲,顯著提升芯片能效,實(shí)現(xiàn)更高的計(jì)算效率。
但這條路并不好走。吳強(qiáng)直言,在H30誕生之前,后摩智能內(nèi)部做了大量的測試驗(yàn)證,“兩年來我們淌過了許多坑,不斷把技術(shù)升級迭代,才向客戶交了第一份答卷。”
從結(jié)果來看,H30的誕生背后實(shí)現(xiàn)了六大技術(shù)突破,即大算力、全精度、低功耗、車規(guī)級、可量產(chǎn)、通用性。
后摩智能聯(lián)合創(chuàng)始人兼研發(fā)副總裁陳亮提到,在存儲介質(zhì)方面,H30基于SRAM,采用數(shù)字存算一體架構(gòu),可擁有更低的訪存功耗和超高計(jì)算密度。同時在Int8精度下,其AI核心IPU能效比高達(dá)15Tops/W,是傳統(tǒng)架構(gòu)芯片的7倍以上。
面對嚴(yán)苛的車規(guī)級要求,后摩智能還自主研發(fā)了硬件增強(qiáng)機(jī)制和檢測機(jī)制,在提升H30可靠性的同時,進(jìn)一步保障功能安全性。
為了充分發(fā)揮存算一體的高計(jì)算效率,后摩智能面向智能駕駛場景自主研發(fā)了第一代 IPU(處理器架構(gòu))——天樞架構(gòu),采用大布局設(shè)計(jì)保障計(jì)算資源的利用效率,以多核/多硬件線程的方式靈活擴(kuò)展算力,H30在實(shí)現(xiàn)2倍性能提升且同時降低50%功耗的優(yōu)勢正得益于此。
陳亮透露,目前第二代天璇架構(gòu)已在研發(fā)中,將采用Mesh互聯(lián)結(jié)構(gòu),可根據(jù)應(yīng)用場景的不同配置計(jì)算單元的數(shù)量,整體性能、效率和靈活性將進(jìn)一步躍升,將面向成本和功耗敏感的智能終端、大模型等場景。第三代天璣架構(gòu)已開始規(guī)劃,面向萬物智能。
03. 智駕芯片落地之后,存算一體向明天加速快跑
正如中國電動汽車百人會副理事長兼秘書長張永偉在后摩智能首款存算一體智駕芯片發(fā)布會上所說,2023年中國汽車芯片市場正處于規(guī)模化上量期,預(yù)計(jì)芯片需求量約為1000億顆左右,同時當(dāng)前全球供應(yīng)鏈形勢也為國產(chǎn)汽車芯片提供了難得的發(fā)展機(jī)遇和時間窗口。
“中國超大規(guī)模市場為每個技術(shù)路線都提供了電動化的發(fā)展空間,芯片的發(fā)展亦是如此。”張永偉說,存算一體技術(shù)不僅能擺脫先進(jìn)制程的供應(yīng)風(fēng)險,也推動著國內(nèi)玩家通過多種技術(shù)路徑進(jìn)行國產(chǎn)化布局,進(jìn)一步提升供應(yīng)鏈的韌性和安全。
而在激烈的全球化競賽中,落地是檢驗(yàn)產(chǎn)品性能的唯一標(biāo)準(zhǔn)。
現(xiàn)階段,H30的商業(yè)落地主要面向商用車和乘用車兩大場景。后摩智能聯(lián)合創(chuàng)始人、產(chǎn)品副總裁信曉旭透露, 目前公司基于H30已成功運(yùn)行常用的經(jīng)典CV網(wǎng)絡(luò)和多種自動駕駛先進(jìn)網(wǎng)絡(luò),包括當(dāng)前業(yè)內(nèi)最受關(guān)注的BEV網(wǎng)絡(luò)模型,以及廣泛應(yīng)用于高階輔助駕駛領(lǐng)域的Pointpillar網(wǎng)絡(luò)模型。
以H30打造的智能駕駛解決方案,如今已經(jīng)在合作伙伴的無人小車上完成部署,“這是業(yè)界第一次基于存算一體架構(gòu)芯片成功運(yùn)行端到端的智能駕駛技術(shù)棧。”信曉旭說。
不僅如此,H30將于6月份開始給Alpha客戶送測。同時,后摩智能第二代產(chǎn)品鴻途H50已經(jīng)在全力研發(fā)中,預(yù)計(jì)將于2024年推出,支持客戶2025年的量產(chǎn)車型。
“L2++是全自動駕駛的必經(jīng)階段,但一定不會是終點(diǎn)。”談及未來,吳強(qiáng)堅(jiān)定地告訴36氪。他認(rèn)為,全自動駕駛一定會通過L2++的不斷普及,收集更多數(shù)據(jù),從而反哺L3、L4技術(shù)的發(fā)展和普及,逐漸真正地把人們從繁重的場景中解放出來,去發(fā)揮更大價值。
基于此,后摩智能未來產(chǎn)品迭代的路徑和方向也逐漸明晰。首先是算力維度,將往更高算力和能效發(fā)展;其次是產(chǎn)品的豐富度和集成度,會逐漸覆蓋更多算力價值之外的場景。
“專注在中大算力場景,我們還會針對不同車型和對成本的考量,推出更豐富的產(chǎn)品系列,以滿足不同類型客戶對性價比的需求。”吳強(qiáng)說。
回歸到技術(shù)本身,若將萬物智能發(fā)展的時間軸進(jìn)一步拉長,其實(shí)智駕芯片并不是后摩智能技術(shù)落地的唯一載體。這就意味著,未來的后摩智能,也將在智駕芯片之外的賽道實(shí)現(xiàn)多點(diǎn)開花,而這一切的根基,離不開多年來后摩智能對存算一體技術(shù)的打磨、積累與創(chuàng)新。
歷經(jīng)50余年發(fā)展,存算一體已走到正式爆發(fā)的前夜。鴻途?H30的亮相,正式開啟了國內(nèi)存算一體大算力AI芯片商用落地的新階段。而它的誕生猶如蝴蝶振翅,其每一步技術(shù)創(chuàng)新、每一環(huán)生態(tài)布局,都將與行業(yè)玩家們一同推動著未來走向萬物智能真正來臨的那一天。
責(zé)任編輯:Rex_11