換道搶跑,性能直逼英偉達(dá)
(資料圖片僅供參考)
文|在洲
冷靜,理性,且對(duì)芯片行業(yè)充滿敬畏。
和后摩智能聯(lián)合創(chuàng)始人、研發(fā)副總裁陳亮對(duì)話的一個(gè)小時(shí)的時(shí)間里,他少有情緒上的變化,不過每次談及技術(shù)相關(guān)的話題,他總會(huì)加重語氣,講起來滔滔不絕,對(duì)芯片制造和設(shè)計(jì)問題如數(shù)家珍。
5月10日,是后摩智能成立兩年來最重要的里程碑,公司研發(fā)兩年的存算一體大算力AI芯片產(chǎn)品——鴻途H30亮相,“就像自己培養(yǎng)的孩子開始接受檢驗(yàn)一樣。”
鴻途H30是國(guó)內(nèi)第一款量產(chǎn)存算一體智駕芯片,于行業(yè)來說,將多了一個(gè)底層架構(gòu)完全不同的大算力AI芯片的選擇,于后摩來說,公司第一款產(chǎn)品,終于等到推向市場(chǎng)的時(shí)刻。
存算一體的優(yōu)勢(shì)在于,打破了現(xiàn)代計(jì)算機(jī)技術(shù)中馮·諾伊曼架構(gòu)的存儲(chǔ)墻和能效墻的瓶頸,既存儲(chǔ)數(shù)據(jù)也能處理數(shù)據(jù),可以顯著提升能效比,實(shí)現(xiàn)大算力、低功耗。而且存算一體芯片,不需要依賴先進(jìn)制程工藝和封裝技術(shù),成本大大降低。
基于這種底層邏輯的創(chuàng)新,讓鴻途H30有了和大廠產(chǎn)品掰手腕的底氣。
從賬面數(shù)據(jù)來看,這款后摩花兩年打造的芯片足夠驚艷。鴻途H30基于 SRAM 存儲(chǔ)介質(zhì),最高物理算力可以達(dá)到256TOPS,典型功耗 35W,在 Int8 數(shù)據(jù)精度條件下,其 AI 核心IPU 能效比高達(dá)15Tops/W,是傳統(tǒng)架構(gòu)芯片的7倍以上。
鴻途H30還支持運(yùn)行點(diǎn)云網(wǎng)絡(luò),以及BEV網(wǎng)絡(luò),能夠支持 L2+ 到L4 級(jí)自動(dòng)駕駛。此外,這顆芯片采用了更加靈活的散熱方式,車企可以實(shí)現(xiàn)更低成本的部署,開源的通用計(jì)算平臺(tái),也大大降低了主機(jī)廠開發(fā)的成本,并縮短適配周期。
在陳亮看來,車企搭載存算一體芯片,無論耗費(fèi)的時(shí)間還是資金,都是一筆非常劃算的買賣。
作為公司首款產(chǎn)品,鴻途H30的重要性不言而喻,但面對(duì)如此重要的時(shí)間節(jié)點(diǎn),陳亮并沒有太大波動(dòng),“平常心就好”。
在他看來,舉辦產(chǎn)品發(fā)布會(huì)只是第一步,后面還有很多工作要做,比如要做到量產(chǎn),要滿足客戶的要求,還要卡在6月節(jié)點(diǎn)送測(cè)等。
雖然存算一體芯片行業(yè)站在爆發(fā)前夜,但產(chǎn)業(yè)化尚處于起步階段,無論是初期開發(fā)還是產(chǎn)業(yè)鏈上下游適配,都在摸著石頭過河。
陳亮清楚,作為存算一體行業(yè)的先行者,前路定會(huì)荊棘遍布。“被別人趕超也是好事,即便我們這個(gè)公司做不成,做這件事的價(jià)值還是非常有意義。”
作為在芯片行業(yè)扎根十幾年的老人,陳亮認(rèn)定了公司選定的方向不會(huì)錯(cuò)。基于芯片底層技術(shù)創(chuàng)新,其存算一體產(chǎn)品在同樣的性能下功耗會(huì)低很多,同樣功耗下性能會(huì)高很多。即便行業(yè)處于拓荒階段,陳亮仍然篤定地認(rèn)為,存算一體將會(huì)是未來人工智能發(fā)展的必然方向。
“我們用兩年時(shí)間做到了業(yè)界沒有人做到過的事情,真心為公司每一個(gè)人感到驕傲。”
在后摩智能這家初創(chuàng)公司里,還有很多像陳亮這種對(duì)于技術(shù)有著極致追求的研發(fā)人員,他們?cè)诖龊凸倔w量都稍遜的情況下,仍然選擇了后摩智能。“看中的就是從底層做起,還擁有技術(shù)創(chuàng)新。”
陳亮本碩博畢業(yè)于清華大學(xué),曾任海思CPU芯片資深架構(gòu)師、地平線AI芯片首席架構(gòu)師具備10余年高性能CPU/FPGA/ASIC芯片內(nèi)核設(shè)計(jì)及量產(chǎn)經(jīng)驗(yàn),主導(dǎo)過多款A(yù)I芯片設(shè)計(jì),擁有美國(guó)及中國(guó)芯片相關(guān)發(fā)明專利近20項(xiàng)。
站在2023年這個(gè)時(shí)間節(jié)點(diǎn),即便一些自動(dòng)駕駛解決方案供應(yīng)商大打價(jià)格戰(zhàn),并把產(chǎn)品做到幾千元的成本,陳亮也不擔(dān)心鴻途H30的產(chǎn)品力,因?yàn)椤安荒苤豢磧r(jià)格,還要看價(jià)值。”
以下是獵云網(wǎng)與后摩智能聯(lián)合創(chuàng)始人、研發(fā)副總裁陳亮的對(duì)話:(略經(jīng)整理)
時(shí)機(jī)已成熟
Q:兩年前為什么會(huì)選擇加入后摩智能?
A:2021年初,吳強(qiáng)(后摩智能創(chuàng)始人兼CEO)給我打了一個(gè)電話,說可以一起做存算一體芯片,當(dāng)知道了他的想法和對(duì)公司的戰(zhàn)略時(shí),我沒有考慮太久,很快就選擇加入進(jìn)來。因?yàn)楹竽χ悄軇?chuàng)立之初就選擇從底層做起,還有技術(shù)創(chuàng)新。
而且存算一體帶來的技術(shù)和產(chǎn)品的優(yōu)勢(shì),和智能駕駛的關(guān)鍵需求天然吻合,因?yàn)橹悄荞{駛的終局是要替代人的駕駛,我們用傳感器代替人的眼睛,用各式各樣的算法填補(bǔ)人的意識(shí)和靈魂。底層的智能駕駛芯片又扮演著人類大腦的角色,所以從終局的角度來看,智能駕駛芯片一定要無限接近人大腦的行駛和效率。
Q:發(fā)布會(huì)現(xiàn)場(chǎng),你說很多人選擇后摩智能的時(shí)候,薪資不是重要的考量因素。
A:是的,我們團(tuán)隊(duì)每個(gè)人都在專心做好自己的事情,覺得我們做的事非常有價(jià)值,每個(gè)人在這里都可以充分發(fā)揮自己的積極性,表達(dá)自己的想法,團(tuán)隊(duì)每天都非常有活力,這是他們最看重的。
Q:可以介紹一下團(tuán)隊(duì)研發(fā)人員背景嗎?
A:團(tuán)隊(duì)基本都是科班出身,既有來自英偉達(dá)、海思、高通、寒武紀(jì)等芯片企業(yè),也有來自阿里巴巴、百度等科技公司,主要以具有存算一體領(lǐng)域原創(chuàng)科研能力的人為主。
Q:現(xiàn)在研發(fā)部門有多少人?
A:研發(fā)團(tuán)隊(duì)占公司人數(shù)一半以上,有百分之七八十都是研發(fā)人員。
Q:兩年來最大的收獲是什么?
A:最大的一個(gè)收獲就是要考慮的事情確實(shí)是更多了,比如人的因素、產(chǎn)品、客戶等各個(gè)方面要考慮的因素更多。而且要把一件事或者一個(gè)很好的想法變成現(xiàn)實(shí),需要綜合各個(gè)方面考慮,而不能是像一個(gè)工程師一樣去處理,按照工程師的思維,沒辦法運(yùn)營(yíng)公司。
Q:接下來最重要的一件事是什么?
A:最重要的其實(shí)有兩件事,一個(gè)是我們第一代芯片交付,第二件事就是第二代芯片的研發(fā)。
價(jià)值比價(jià)格更重要
Q:新產(chǎn)品發(fā)布之際,自己的心情如何,激動(dòng)嗎?
A:沒有什么特別的心情,繼續(xù)做該做的工作,激動(dòng)也談不上,因?yàn)楹竺孢€有很多工作要做,要量產(chǎn)、要給客戶送測(cè),然后產(chǎn)品很多功能都要做,平常心吧。
Q:目前這個(gè)產(chǎn)品節(jié)奏符合自己的預(yù)期嗎?
A:基本符合,當(dāng)然我們希望能夠越快越好,不過我們的AI處理器以及存算電路等,完全都是自己做的,這就意味著需要比別人做更多的工作,也會(huì)更深1~2個(gè)層次,所以也不能著急。
Q:那你們接下來如何說服車企搭載自己的產(chǎn)品?
A:首先從產(chǎn)品角度來說,鴻途H30有著256T的AI物理算力,這么大的物理算力,在當(dāng)前的國(guó)內(nèi)AI芯片是第一個(gè)。它的典型功耗只有35W左右,能效是其他產(chǎn)品的幾倍,是目前國(guó)內(nèi)效率最高的大算力智能駕駛芯片。
而且35W是我們芯片和一個(gè)主控芯片,兩個(gè)加起來的功耗,我們單個(gè)芯片的功耗其實(shí)只有20W到25W。
從開發(fā)的角度來說,存算一體技術(shù)是對(duì)開發(fā)者無侵入式的底層架構(gòu)創(chuàng)新,從編程角度來看用戶感知不到任何底層硬件的影響,再有我們也會(huì)做一些車規(guī)的認(rèn)證,這方面也不存在障礙。
Q:不過現(xiàn)在自動(dòng)駕駛行業(yè)其實(shí)非常內(nèi)卷,一些自動(dòng)駕駛解決方案供應(yīng)商都在壓低價(jià)格,很多成本都控制在了萬元以內(nèi),你們?cè)趺纯矗?/p>
A:芯片的價(jià)值不在于單顆芯片的價(jià)格,不在于說賣多少錢一片,而在于長(zhǎng)期上帶來的好處,單一價(jià)格不能等同于價(jià)值。如果真是在要問多少錢一片的話,同樣的性能,我們芯片的面積比其他產(chǎn)品小三倍,就是在同樣的性能條件下功耗更小,功耗小帶來的是整個(gè)系統(tǒng)成本的降低,其中就包括散熱成本。
我們下一代產(chǎn)品就會(huì)主打自然散熱,不需要風(fēng)冷或者散熱這些配件,可以為主機(jī)廠節(jié)省更多的成本。所以真正有價(jià)值的東西,不用局限于單一價(jià)格的衡量標(biāo)準(zhǔn),需要從整體來看。
Q:發(fā)布會(huì)當(dāng)天你們宣布了一個(gè)彩蛋,說是要設(shè)計(jì)開源,具體開放了哪些能力?
A:我們計(jì)劃的開放是非常底層的,未來會(huì)開放整個(gè)硬件的設(shè)計(jì),然后配合我們的軟件工具鏈,就可以把我們的硬件設(shè)計(jì)直接用在自己的產(chǎn)品中。
大家可以在我們網(wǎng)站上下載IPU設(shè)計(jì)資料,在此基礎(chǔ)上就可以做PPA的評(píng)估,做軟件算法的開發(fā)。我們希望有更多的人和組織能夠參與進(jìn)來,相信以大家的智慧可以更好的讓這個(gè)方向落地,大家可以共建生態(tài),最終讓整個(gè)產(chǎn)業(yè)鏈?zhǔn)芤妗?/p>
Q:所以你們?cè)O(shè)計(jì)開源也有打造生態(tài)的考慮?
A:是的,首先我們還是把自己定位為Tier 2,我們所做得是最底層的通用計(jì)算平臺(tái),這個(gè)計(jì)算平臺(tái)包括了硬件底層的操作系統(tǒng),上層的應(yīng)用算法都是交給客戶或者合作伙伴去做。
我們的芯片采用HDPL語言編程,它是我們IPU架構(gòu)的CUDA語言拓展,金融CUDA的前端語法和CUDA運(yùn)行時(shí),高效解決了數(shù)據(jù)并行問題,而且支持消息傳遞機(jī)制。我們的Tile內(nèi)部是有異構(gòu)的計(jì)算單元組成的,所以我們?cè)诤藘?nèi)采用異構(gòu)的SIMD編程模型。
而在核間、Tile間都是同構(gòu)的設(shè)計(jì),所以采用CMT的編程模型。像一些底層復(fù)雜的機(jī)制,比如數(shù)據(jù)共享,消息傳遞等等,都被我們出色的軟件工具鏈團(tuán)隊(duì)包裝起來。大家只要使用我們的開發(fā)套件,使用一些非常簡(jiǎn)單的簡(jiǎn)潔易用的編程接口,就可以在我們的IPU上高效的開發(fā)自己的軟件和算法。
不擔(dān)心被趕超
Q:在創(chuàng)投圈一直有個(gè)說法,就是初創(chuàng)公司做的這件事,BBA做了怎么辦?你們?cè)趺纯创@個(gè)問題?
A:所有的初創(chuàng)公司都會(huì)面臨這個(gè)問題,但你看還是有很多公司會(huì)活下來。與其杞人憂天地揣測(cè)會(huì)不會(huì)被大廠超越,不如先關(guān)心自己怎么能把產(chǎn)品做得更好。
我們作為一家初創(chuàng)公司,選擇了一個(gè)相對(duì)前沿的技術(shù)路徑,就是要做出人無我有、人有我優(yōu)的產(chǎn)品。做芯片不是一蹴而就的,從硬件到軟件,每一個(gè)環(huán)節(jié)都依賴于有效打磨,其中的先發(fā)優(yōu)勢(shì)不僅在于時(shí)間和資源,更重要的是工程化驗(yàn)證的有效經(jīng)驗(yàn)。
Q:存算一體雖然處于爆發(fā)階段,但智駕芯片的同行者并不多,后摩作為第一個(gè)吃螃蟹的人,會(huì)不會(huì)擔(dān)心被后來者趕超?
A:我覺得趕超也挺好的,存算一體這個(gè)賽道值得更多人加入,就算這個(gè)公司做不成,我們做這件事的價(jià)值也不會(huì)消失,無論我們最后能不能成功,對(duì)于行業(yè)來說都是具有意義的。
Q:開發(fā)第一款量產(chǎn)存算一體芯片,在設(shè)計(jì)過程中有沒有遇到一些難題?
A:確實(shí)有好多問題都是之前沒有遇到過的,比如去年,我們發(fā)現(xiàn)存算電路會(huì)在非常偶然的情況下會(huì)出現(xiàn)計(jì)算的錯(cuò)誤,無論怎么做試驗(yàn)總是找不到原因。
這個(gè)問題不解決,不管是性能還是良率都會(huì)出現(xiàn)問題。最后我們都幾乎絕望了,甚至懷疑是不是有三體人發(fā)射質(zhì)子來封鎖我們的科技。好在反復(fù)確認(rèn)后,發(fā)現(xiàn)就是因?yàn)殡娐防镆粋€(gè)小小的行為沒有反映在行為模型里導(dǎo)致的。
Q:這也說明開發(fā)過程中會(huì)產(chǎn)生很多意想不到的問題,其實(shí)自動(dòng)駕駛技術(shù)的發(fā)展迭代本就是發(fā)現(xiàn)問題解決問題的過程,你們又是如何在交付非常緊張的情況下,保持技術(shù)領(lǐng)先性和應(yīng)用的?
A:從技術(shù)的角度領(lǐng)先性的角度來說,我們的設(shè)計(jì)本就比其他產(chǎn)品的更深至少1~2個(gè)層次。我們也在不斷迭代電路,優(yōu)化的過程沒有止境的,即使是用同樣的工藝,也可以不斷優(yōu)化。有專門的架構(gòu)和算法的團(tuán)隊(duì)去做更前沿的設(shè)計(jì)和研究,我們基本上是在實(shí)施一代、設(shè)計(jì)一代,然后再預(yù)演下一代的節(jié)奏在跟進(jìn)。
Q:對(duì)于自動(dòng)駕駛芯片來說,產(chǎn)品亮相往往是第一步,接下來還有更大的門檻,比如交付的壓力和工程化的問題,你們?cè)趺慈ソ鉀Q這些問題?
A:芯片良率問題我們已經(jīng)解決了,我們的芯片沒有良率很低的問題。我們也會(huì)盡全力配合客戶做相應(yīng)的適配工作。不過我們是做的通用的計(jì)算平臺(tái),設(shè)計(jì)更加開源,可以最大程度保持用戶的開發(fā)習(xí)慣,所以和用戶適配的周期更短,相應(yīng)地,用戶花費(fèi)的時(shí)間和資金成本也會(huì)更低。
至于工程化的問題,我們從設(shè)計(jì)、封裝到成品的流程已經(jīng)走通了,沒有什么障礙。
Q:在接下來和主機(jī)廠合作的過程中,如果遇到一些任務(wù)難以厘清,你們?cè)趺崔k?
A:肯定會(huì)盡全力滿足客戶的需求,如果客戶覺得應(yīng)該這么做,我們盡量按照他們的方式去做適配,也會(huì)提供一些建議或參考,比如說我會(huì)告訴客戶,這么用的話芯片效率可能會(huì)更高,當(dāng)然,也會(huì)提供有Plan A、Plan B等多個(gè)版本供客戶選擇。
責(zé)任編輯:Rex_19