欧美性爱在线观看|午夜福利一区二区不卡片|另类综合第一页欧美丝袜第一区|久久免费精品视频14

  • <cite id="dhbz5"></cite>
    1. <cite id="dhbz5"><table id="dhbz5"></table></cite>
      • 資訊
      • 報告
      當前位置:中研網(wǎng) > 結果頁

      算法:“BEV+Transformer”引領自動駕駛感知范式

      BEV全稱Bird'sEyeView,即鳥瞰圖,該算法旨在將多傳感器收集的圖像信息投射至統(tǒng)一3D空間,再輸入至單一大模型進行整體推理。相較于傳統(tǒng)的攝像頭圖像,BEV提供了一個更貼近實際物理世界的統(tǒng)一空間,為后續(xù)的多傳感器融合以及規(guī)劃控制模塊開發(fā)提供了更大的便利和更多的可B


      大模型是當前AI領域最為火熱的前沿趨勢之一,可賦能自動駕駛領域的感知、標注、仿真訓練等多個核心環(huán)節(jié)。在感知層,以特斯拉為首,"BEV+Transformer"范式已開始在自動駕駛領域得到廣泛使用,可有效提升感知精確度,利于后續(xù)規(guī)劃控制算法的實施,促進端到端自動駕駛框架的發(fā)展。

      BEV全稱Bird'sEyeView,即鳥瞰圖,該算法旨在將多傳感器收集的圖像信息投射至統(tǒng)一3D空間,再輸入至單一大模型進行整體推理。相較于傳統(tǒng)的攝像頭圖像,BEV提供了一個更貼近實際物理世界的統(tǒng)一空間,為后續(xù)的多傳感器融合以及規(guī)劃控制模塊開發(fā)提供了更大的便利和更多的可能。具體來說,BEV感知的優(yōu)勢在于:1)統(tǒng)一了多模態(tài)數(shù)據(jù)處理維度,將多個攝像頭或雷達數(shù)據(jù)轉換至3D視角,再做目標檢測與分割等任務,從而降低感知誤差,并為下游預測和規(guī)劃控制模塊提供更豐富的輸出;2)實現(xiàn)時序信息融合,BEV下的3D視角相較于2D信息可有效減少尺度和遮擋問題,甚至可通過先驗知識"腦補"被遮擋的物體,有效提高自動駕駛安全性;3)感知和預測可在統(tǒng)一3D空間中實施,通過神經(jīng)網(wǎng)絡直接完成端到端優(yōu)化,可有效降低傳統(tǒng)感知任務中感知與預測串行的誤差累積。

      Transformer的注意力(Attention)機制可幫助實現(xiàn)2D圖像數(shù)據(jù)至3DBEV空間的轉化。Transformer是GoogleBrian團隊在2017年提出的神經(jīng)網(wǎng)絡模型,起初用于機器翻譯,隨著技術的發(fā)展開始進軍圖像視覺領域,目前已成功涉足分類、檢測和分割三大圖像問題。據(jù)汽車之心微信公眾號介紹,傳統(tǒng)CNN模型的原理是通過卷積層構造廣義過濾器,從而對圖像中的元素進行不斷地篩選壓縮,因此其感受域一定程度上取決于過濾器的大小和卷積層的數(shù)量。隨著訓練數(shù)據(jù)量的增長,CNN模型的收益會呈現(xiàn)過飽和趨勢。而Transformer的網(wǎng)絡結構在嫁接2D圖像和3D空間時借鑒了人腦的注意力(Attention)機制,在處理大量信息時能夠只選擇處理關鍵信息,以提升神經(jīng)網(wǎng)絡的效率,因此Transformer的飽和區(qū)間很大,更適宜于大規(guī)模數(shù)據(jù)訓練的需求。在自動駕駛領域,Transformer相比于傳統(tǒng)CNN,具備更強的序列建模能力和全局信息感知能力,目前已廣泛用于視覺2D圖像數(shù)據(jù)至3D空間的轉化。

      除感知層外,大模型還有望顯著提升后端訓練中數(shù)據(jù)清洗標注的效率,并助力生成新場景以賦能仿真訓練。訓練模型在收集到傳感器傳送回的圖像數(shù)據(jù)后,需先對數(shù)據(jù)進行清洗,再對其中的車輛、行人、道路標識、車道線等元素進行標注。相較于此前的人工標注,大模型可以大幅提升工作效率。理想汽車創(chuàng)始人李想在中國電動汽車百人會論壇(2023)的演講中表示,此前理想一年要做大概1000萬幀自動駕駛圖像的人工標定,年成本接近1億元,但使用軟件2.0大模型進行自動化標定后,效率是人的1000倍。毫末智行也2023年4月第八屆AIDAY上表示,其最新推出的DriveGPT可將交通場景圖像的標注費用從行業(yè)平均約5元/張降至約0.5元/張。Meta最新的圖像分割模型SAM(SegmentAnythingModel)在對圖像和視頻中的物體進行識別分割時展現(xiàn)出了強大的能力,且具有零樣本性能,即能夠?qū)奈从柧氝^的圖片進行精準分割,未來也有望賦能自動駕駛訓練所需的圖像數(shù)據(jù)積累。

      在"BEV+Transformer"趨勢下,算法復雜度、數(shù)據(jù)規(guī)模以及模型參數(shù)均呈指數(shù)級提升,推動自動駕駛芯片向著大算力、新架構以及存算一體等方向演進。

      1、大算力:

      向數(shù)百TOPS算力演進。傳統(tǒng)L1/L2輔助駕駛所需處理的數(shù)據(jù)量小且算法模型相對簡單,因此以Mobileye為代表的單目視覺+芯片算法強耦合的一體機方案即可滿足需求。但領航功能作為高階輔助駕駛的代表,需要"更強算力+軟硬件解耦的芯片+域控制器"來滿足海量數(shù)據(jù)處理與后續(xù)持續(xù)OTA迭代的需求。高速領航開始向20萬以下車型滲透,15-30TOPS可滿足基本需求,但若想要"好用"或需要30-80TOPS。城區(qū)領航的場景復雜程度和技術實現(xiàn)難度更高,目前普遍需要搭載激光雷達,芯片以英偉達Orin、華為MDC和地平線J5為主,算力配置普遍超200TOPS。而在應用"BEV+Transformer"技術后,多傳感器前融合以及2D至3D空間的轉化需要AI芯片具備更強的推理能力,因此也需要比以往更大的算力支撐,包括更高的AI算力、CPU算力和GPU算力。

      2、新架構:

      加強并行計算能力和浮點運算能力。相較于CNN/RNN,Transformer具有更強的并行計算能力,可加入時間序列矢量,其數(shù)據(jù)流特征有顯著差別,浮點矢量矩陣乘法累加運算更適合采用BF16精度。Transformer允許數(shù)據(jù)以并行的形式進行計算,且保留了數(shù)據(jù)的全局視角,而CNN/RNN的數(shù)據(jù)流只能以串行方式計算,不具備數(shù)據(jù)的全局記憶能力。傳統(tǒng)AI推理專用芯片大多針對CNN/RNN,并行計算表現(xiàn)不佳,且普遍針對INT8精度,幾乎不考慮浮點運算。因此想要更好適配Transformer算法,就需要將AI推理芯片從硬件層面進行完整的架構革新,加入專門針對Transformer的加速器,或使用更強的CPU算力來對數(shù)據(jù)整形,這對芯片架構、ASIC研發(fā)能力,以及成本控制都提出了更高的要求。以特斯拉、地平線為代表的廠商均"重ASIC(即AI推理專用芯片),輕GPU"。特斯拉引領BEV+Transformer路線,以專用NPU(神經(jīng)網(wǎng)絡處理器)承擔AI運算,在NPU設計之初便進行了針對性優(yōu)化。而地平線等后來者或需要在下一代芯片中對AI推理芯片架構進行針對性優(yōu)化。

      3、存算一體:

      SoC芯片需配置高帶寬存儲器(HBM)或SRAM,并加速向存算一體靠攏,解決大算力下的數(shù)據(jù)吞吐量瓶頸。模型越大,內(nèi)存對AI加速器就越重要,以頻繁地讀取權重矩陣或訓練好的模型參數(shù)。據(jù)佐思汽研介紹,Transformer中的權重模型超過1GB,對比傳統(tǒng)CNN的權重模型通常不超過20MB。模型參數(shù)越大,就需要更高的帶寬,一次性讀出更多參數(shù)。存算一體可分為近存計算(PNM)、存內(nèi)處理(PIM)以及存內(nèi)計算(CIM),存內(nèi)計算則接近存算一體,當前PNM已廣泛用于高性能芯片,即采用HBM堆疊,2.5D封裝,從而與CPU集成,而PIM和CIM仍處在發(fā)展中。以特斯拉FSDSoC為例,其采用總帶寬為68GB/s的8顆LPDDR4內(nèi)存,而集成在NPU中的SRAM可達到32MBL3緩存,帶寬達2TB/s,遠超市面上同類芯片。而據(jù)汽車之心微信公眾號,特斯拉在最新HW4.0上的二代FSDSoC上使用了16顆GDDR6,在內(nèi)存用料上繼續(xù)引領行業(yè)。

      欲了解更多中國智能駕駛行業(yè)的未來發(fā)展前景,可以點擊查看中研普華產(chǎn)業(yè)院研究報告2023-2028年中國智能駕駛行業(yè)市場深度全景調(diào)研及投資前景分析報告》。


      中研網(wǎng)公眾號

      關注公眾號

      免費獲取更多報告節(jié)選

      免費咨詢行業(yè)專家

      延伸閱讀

      推薦閱讀

      算力市場研究報告分析:我國算力產(chǎn)業(yè)的發(fā)展情況

      我國算力產(chǎn)業(yè)的發(fā)展情況近期,工業(yè)和信息化部聯(lián)合有關部門印發(fā)了《算力基礎設施高質(zhì)量發(fā)展行動計劃》,大家都很關注,...

      2023消費電子行業(yè)發(fā)展分析 消費電子產(chǎn)業(yè)鏈業(yè)績逐季改善

      消費電子一般指消費電子產(chǎn)品,是指圍繞著消費者應用而設計的與生活、工作娛樂息息相關的電子類產(chǎn)品,最終實現(xiàn)消費者自...

      中老年鞋行業(yè)市場現(xiàn)狀及未來前景預測分析

      作為鞋類市場近些年興起的一個細分領域,老人鞋一直呈快速發(fā)展態(tài)勢。老人鞋,也叫老年鞋,是近些年鞋類市場上興起的一...

      2023造船行業(yè)發(fā)展狀況:三季度中國造船產(chǎn)能利用監(jiān)測指數(shù)同比增長超兩成

      船舶工業(yè)是現(xiàn)代綜合性產(chǎn)業(yè),也是軍民結合的戰(zhàn)略性產(chǎn)業(yè),能夠為海洋開發(fā)、水上交通運輸、能源運輸、國防建設等提供必要...

      我國期貨行業(yè)的發(fā)展態(tài)勢 國內(nèi)150家期貨公司總資產(chǎn)1.7萬億元

      中國期貨業(yè)協(xié)會最新數(shù)據(jù)顯示,5月全國期貨市場成交量為8.25億手,成交額為50.37萬億元,同比分別增長75.16%和25.60%...

      中國集裝箱租賃行業(yè)市場分析:總體租箱需求將持續(xù)增長

      集裝箱租賃是指集裝箱租賃公司與承租人,一般為海運班輪公司,鐵路、公路運輸公司等,簽訂協(xié)議,用長期或短期的方式把...

      猜您喜歡

      【版權及免責聲明】凡注明"轉載來源"的作品,均轉載自其它媒體,轉載目的在于傳遞更多的信息,并不代表本網(wǎng)贊同其觀點和對其真實性負責。中研網(wǎng)倡導尊重與保護知識產(chǎn)權,如發(fā)現(xiàn)本站文章存在內(nèi)容、版權或其它問題,煩請聯(lián)系。聯(lián)系方式:jsb@chinairn.com、0755-23619058,我們將及時溝通與處理。

      中研普華集團聯(lián)系方式廣告服務版權聲明誠聘英才企業(yè)客戶意見反饋報告索引網(wǎng)站地圖 Copyright ? 1998-2023 ChinaIRN.COM All Rights Reserved.    版權所有 中國行業(yè)研究網(wǎng)(簡稱“中研網(wǎng)”)    粵ICP備05036522號

      研究報告

      中研網(wǎng)微信訂閱號微信掃一掃