鉅大LARGE | 點(diǎn)擊量:966次 | 2019年10月25日
通用無人車及傳感器剖析
通用汽車在2018年1月13日發(fā)布通用無人車安全報告,并宣稱將在2019年量產(chǎn)基于Bolt純電動車改裝的無人車,本文根據(jù)公開資料對通用無人車做一些分析估計(jì),可能會有錯誤的地方,僅供大家參考。
通用的無人車沒有方向盤和踏板,顯然是無法人工介入,也彰顯通用對自己無人車技術(shù)的信心。同時也顯示出傳統(tǒng)車企在無人車領(lǐng)域強(qiáng)大的競爭力,如果谷歌想要做類似的無人車,那么谷歌必須求助于菲亞特克萊斯勒FCA為其定做。這就是新興造車企業(yè)或IT自動駕駛企業(yè)的尷尬之處,不和傳統(tǒng)車企合作,它們無法拿到一款相對比較優(yōu)秀的改裝平臺,算法再強(qiáng)大也無法落地。
新興造車企業(yè)或IT自動駕駛企業(yè)也無法得到優(yōu)秀汽車廠家的支持,因?yàn)閮?yōu)秀汽車廠家視其為競爭對手,只會盡力打壓,不會出手援助。只有非主流的車廠,才不把新興造車企業(yè)或IT自動駕駛企業(yè)視為競爭對手,同時為了消化過剩的產(chǎn)能,樂于與新興造車企業(yè)或IT自動駕駛企業(yè)合作。另一個尷尬的是特斯拉,雖然只達(dá)到SAE分級中的L2,但是宣傳成L4,一時占盡風(fēng)頭,然而技術(shù)力量不足。L2終究是L2,奧迪A8的L3和通用Cruise的L5(也未完全達(dá)到SAE的L5級,稱L4+更合適)無論在實(shí)際應(yīng)用和宣傳上都超過了特斯拉。
Model3遲遲未達(dá)預(yù)期,特斯拉在2017年第四季度預(yù)期交付Model3新車2917輛,但實(shí)際只交付了1550輛,12月僅交付517輛。作為Model3的競爭對手,通用的Bolt銷量持續(xù)攀升,7月銷量為1971輛,11月達(dá)3747輛,12月銷量達(dá)3327輛,同比大增近5倍,是Model3的6倍。全年銷量超過23000輛,對通用來說產(chǎn)能完全不是問題,每月3萬輛的產(chǎn)能也能輕易達(dá)到。
通用這輛無人車采用5個激光特種,21個毫米波特種,16個攝像頭。5個激光特種是Velodyne的VLP1616線激光特種。今年1月初,Velodyne下調(diào)VLP16的售價,從7999美元到3999美元,百度和福特作為Velodyne的大股東,可以賺通用的錢了。21個毫米波特種中12個79GHz毫米波特種由日本ALPS提供,兩個前向兩個后向長距離毫米波特種推測由德國大陸提供,型號可能是ARS-408。5個高分辨率(通用稱之為Articulating)毫米波特種由德國博世提供,主要是車兩側(cè)和正前方。
16個攝像頭中,車頂10個,包括一個基線長大約8厘米的雙目攝像頭,8個360度環(huán)視攝像頭,攝像頭周圍均有紅外LED,可以在低照度甚至黑夜下工作,當(dāng)然分比率會下降很多。車內(nèi)后視鏡位置有一個非無人駕駛版Bolt的單目攝像頭,車輛最前部位置有一個長距離單目攝像頭。車外后視鏡和車后部各兩個攝像頭。
激光特種應(yīng)用
通用的原文是We start with LiDAR, which provides highly precise feedback using laser measurements for both fixed and moving objects.激光特種首先是定位,無人車的第一步也是定位,利用激光特種SLAM的回環(huán)檢測或者與全局地圖做match,進(jìn)而做到厘米級定位,這是業(yè)內(nèi)一致的做法,百度、谷歌和通用主流廠家都是如此。而非主流廠家大多用GPSRTK定位,有兩個非常顯眼的蘑菇天線,GPSRTK定位不能做大規(guī)模應(yīng)用,只能用于拉投資的demo。
激光特種的第二個作用是與攝像頭數(shù)據(jù)融合做目標(biāo)分類識別和軌跡跟蹤,通用的原文是這樣子:We combine LiDAR and camera data for classifying and tracking objects, making high confidence determinations more quickly. This helps, for example, identify pedestrians, vehicle types and road details such as lane lines, construction zones and signage推測由兩側(cè)朝下的激光特種來獲得道路細(xì)節(jié),如車道線,路沿,隔離帶,虛實(shí)線,斑馬線。百度無人車也是用激光特種獲得道路細(xì)節(jié),出身百度的景馳則在2018年CES上演示了只用激光特種識別車道線、行人和車輛的技術(shù)。谷歌和豐田也是如此。
目前激光特種檢測車道線主要有四種方法,一是根據(jù)激光特種回波寬度。二是根據(jù)激光特種反射強(qiáng)度信息形成的灰度圖,或者根據(jù)強(qiáng)度信息與高程信息配合,過濾出無效信息。三是激光特種SLAM與高精度地圖配合,不僅檢測車道線還進(jìn)行自車定位。四是利用激光特種能夠獲取路沿高度信息或物理反射信息不同的特性,先檢測出路沿,因?yàn)榈缆穼挾仁且阎鶕?jù)距離再推算出車道線位置。對于某些路沿與路面高度相差低于3厘米的道路,這種方法無法使用。后三種方法需要多線激光特種,最少也是16線激光特種。前者可以使用4線或單線激光特種。目前絕大部分都是采用第二種方法。這種方法的標(biāo)志就是需要激光特種盡量貼近路面或朝向路面以取得比較多的反射強(qiáng)度信息,豐田、谷歌都是在車最前部保險杠處安置激光特種,通用由于保險杠附近有9個毫米波特種和1個攝像頭,估計(jì)是安裝空間不足,只能放在車頂。
中間正前方的激光特種與攝像頭數(shù)據(jù)融合可以加大識別目標(biāo)的速度和準(zhǔn)確性。用激光特種識別目標(biāo)有兩種做法,一種是利用激光特種反射強(qiáng)度值,不同特性的物質(zhì)對激光特種反射強(qiáng)度差異很大,利用這個差異可以對目標(biāo)進(jìn)行簡單分類,比如行人、車輛、建筑物、植物、路面、草地等。由于只是簡單的閾值濾波器,計(jì)算量很小,速度極快,遠(yuǎn)高于深度學(xué)習(xí)的目標(biāo)分類。就在2018年1月初,瑞薩宣布和初創(chuàng)公司Dibotics合作,Dibotics有一款增強(qiáng)激光特種(AugmentedLiDAR)軟件,就是采用這種方法做分類識別,瑞薩將把這套軟件嵌入進(jìn)其芯片中。第二種是將激光特種的點(diǎn)云轉(zhuǎn)換為具備張量結(jié)構(gòu)的密集的圖像數(shù)據(jù),然后用fasterRCNN識別。后者需要強(qiáng)大的運(yùn)算資源,處理速度比較慢。fasterRCNN則是圖像識別領(lǐng)域公認(rèn)最優(yōu)秀的方法。推測通用用了前一種,而攝像頭的深度學(xué)習(xí)識別,通用應(yīng)該也是用fasterRCNN。
激光特種還有一個優(yōu)勢就是擅長預(yù)測移動物體的軌跡和軌跡跟蹤,這是行為決策的基礎(chǔ)。就像人類駕駛員,可以預(yù)估行人或其他車輛下一步的方向或位置,根據(jù)這個預(yù)估來做出決策。激光特種天生具備軌跡場(trajectory-yielding)的能力,Velodyne的16線激光特種在美國最隆重的超級碗賽事上能夠準(zhǔn)確預(yù)測四分衛(wèi)投球后球的移動位置(AVelodyneVLP-16LiDARreadoffeachtossedfootball’sspeedanddirectiontopredictwheretheballwouldland)。Velodyne對此非常自豪。所以通用也說用激光特種trackingobjects,這比攝像頭用光流法計(jì)算軌跡并預(yù)測要快得多,運(yùn)算資源消耗也遠(yuǎn)遠(yuǎn)低于光流法。
毫米波特種應(yīng)用
在美國,如果要想使用未經(jīng)FCC認(rèn)證的無線設(shè)備,必須先申請臨時許可(STA),否則是違法行為。2017年3月17日,日本車用電子供貨商AlpsElectric申請了STA許可證,AlpsElectric要測試的是名為Ukaza的車用毫米波特種,工作頻段為76-81GHz。這是該頻段毫米波特種第一次公開測試。在申請中,AlpsElectric表示,公司想從5月1日起陸續(xù)測試3,000臺Ukaza。Alps表示每輛車需要裝配10組特種,因此3,000臺Ukaza只夠300輛車使用。10天后,通用也向FCC遞交了類似的STA許可證申請,它要測試的也是Ukaza特種。不過,通用工程師RobertReagan在申請中要求FCC幫忙保密,因?yàn)闇y試涉及商業(yè)敏感信息。顯然,ALPS的毫米波特種是用在通用汽車上的,這就是通用要打造的300輛的無人駕駛測試車隊(duì)。
Ukaza特種可不是Bolt的唯一裝備,3月28日(通用申請后一天)博世也遞交了自己的STA許可證申請。博世申請中表示,公司要在客戶的自動駕駛車隊(duì)測試中程特種(77GHz),隨后透過搜集的數(shù)據(jù)開發(fā)新的算法。從申請來看,博世要測試的特種共有650組,夠162輛車使用。每輛車4個,與Alps公司類似,博世也沒有點(diǎn)出客戶的名字,但給了測試的具體地點(diǎn),從經(jīng)緯度來看,這些特種將在舊金山、底特律和斯科茨代爾測試,唯一橫跨這三地測試的公司只有通用一家。
經(jīng)過幾個月測試后,通用可能覺得還不夠,因此增加了數(shù)量,79GHz增加到12個,高分辨率(通用稱之為Articulating)毫米波特種增加到5個。博世的特種如果是傳統(tǒng)的77GHz毫米波特種,應(yīng)該無需再向FCC提出STA,推測可能是2-4GHz帶寬的特種,也可能博世把76-81GHz特種(也就是79GHz特種)稱為77GHz特種,畢竟博世不能造特種收發(fā)器,也是79GHz特種的可能性很高,其帶寬最高是傳統(tǒng)77GHz特種的8倍,因此分辨率可達(dá)4厘米,稱之為Articulating也說得過去。
12個79GHz毫米波特種采用級聯(lián)方式工作,這種方式足以讓毫米波特種呈現(xiàn)出清晰的360度全景圖像,還可以同時跟蹤上千目標(biāo)。推測12個79GHz毫米波特種是做冗余系統(tǒng),毫米波特種應(yīng)對復(fù)雜環(huán)境的能力最強(qiáng),最適合做冗余系統(tǒng),在激光特種和攝像頭都失效的情況下,依然可以安全行駛到路邊停車。
NXP在2018年1月11日推出MR3003和S32R274就是典型的級聯(lián)設(shè)計(jì)方案,MR3003是一款3發(fā)4收的毫米波特種收發(fā)器,NXP的級聯(lián)設(shè)計(jì)最低是級聯(lián)4個MR3003,達(dá)到12發(fā)16收,由S32R274做處理器,最多可支持高達(dá)20個MR3003級聯(lián),達(dá)到驚人的60發(fā)80收毫米波特種,足以成像。
所謂級聯(lián),實(shí)際類似MIMO。多輸人多輸出系統(tǒng)(MIMO,Multipleinputmultipleoutput)原本是控制系統(tǒng)中的一個概念,表示一個系統(tǒng)有多個輸入和多個輸出.如果將移動通信系統(tǒng)的傳輸信道看成一個系統(tǒng),則發(fā)射信號可看成移動信道(系統(tǒng))的輸入信號,而接收信號可看成移動信道的輸出信號。MIMO特種的基本含義是:特種采用多個發(fā)射天線,同時發(fā)射相互正交的信號,對目標(biāo)進(jìn)行照射,然后用多個接收天線接收目標(biāo)回波信號并對其進(jìn)行綜合處理,提取目標(biāo)的空間位置和運(yùn)動狀態(tài)等信息。
MIMO特種虛擬陣的一個典型應(yīng)用是用于特種二維成像,特種二維成像的距離分辨力主要取決于特種信號的帶寬,方位分辨力主要取決于天線的波束寬度。要提高成像的距離分辨力,需要增加特種信號的帶寬是相對比較容易的。而要提高特種信號的方位分辨力,需要增大天線或陣列的孔徑,而這在實(shí)際中受到多方面因素的限制,有很大的難度。目前廣泛采用的解決辦法是采用合成孔徑技術(shù),在不增加天線物理尺寸的基礎(chǔ)上,得到大孔徑的陣列。與合成孔徑的思想不同,MIMO特種是利用多發(fā)多收的天線結(jié)構(gòu)等效形成虛擬的大孔徑陣列,獲得方位上的高分辨力。而這種虛擬陣的形成是實(shí)時的,能夠避免傳統(tǒng)的ISAR成像中存在的運(yùn)動補(bǔ)償問題。故MIMO特種在成像應(yīng)用上有其獨(dú)特的優(yōu)勢。
攝像頭應(yīng)用
在自主導(dǎo)航局部路徑規(guī)劃方面,根據(jù)通用的描述,通用似乎是使用了自由空間(FreeSpace)法,這是通用與百度和谷歌最大的區(qū)別,百度和谷歌都使用柵格法。柵格法是目前應(yīng)用最廣泛,可靠性最高的一種局部路徑規(guī)劃。它是由w.E.Howden在1968年提出的。柵格法將機(jī)器人工作環(huán)境分解成一系列具有二值信息的網(wǎng)格單元,工作空間中障礙物的位置和大小一致,并且在機(jī)器人運(yùn)動過程中,障礙物的位置和大小不發(fā)生變化。用尺寸相同的柵格對機(jī)器人的二維工作空間進(jìn)行劃分,柵格的大小以機(jī)器人自身的尺寸為準(zhǔn)。若某個柵格范圍內(nèi)不含任何障礙物,則稱此柵格為自由柵格;反之,稱為障礙柵格。自由空間和障礙物均可表示為柵格塊的集成。柵格的標(biāo)識方法有兩種:直角坐標(biāo)法和序號法。多采用四叉樹或八叉樹表示工作環(huán)境,并通過優(yōu)化算法完成路徑搜索。該方法以柵格為單位記錄環(huán)境信息,柵格粒度越小,障礙物的表示越精確,但同時會占用大量的存儲空問,算法的搜索范圍將按指數(shù)增加,會大量消耗運(yùn)算資源。這種方法一般都配合64線機(jī)械旋轉(zhuǎn)激光特種,線數(shù)越高就可以劃分粒度越小。所以會出現(xiàn)128線激光特種和蘋果那種12個16線激光特種,未來可能還有256線激光特種。整體成本太高是柵格法主要缺點(diǎn)。
自由空間法采用預(yù)先定義的如廣義錐形和凸多邊形等基本形狀構(gòu)造自由空間,并將自由空間表示為連通圖,通過搜索連通圖來進(jìn)行路徑規(guī)劃。自由空間的構(gòu)造方法是:從障礙物的一個頂點(diǎn)開始,依次作其它頂點(diǎn)的鏈接線,刪除不必要的鏈接線,使得鏈接線與障礙物邊界所圍成的每一個自由空間都是面積最大的凸多邊形:連接各鏈接線的中點(diǎn)形成的網(wǎng)絡(luò)圖即為機(jī)器人可自由運(yùn)動的路線。其優(yōu)點(diǎn)是比較靈活,起始點(diǎn)和目標(biāo)點(diǎn)的改變不會造成連通圖的重構(gòu),缺點(diǎn)是復(fù)雜程度與障礙物的多少成正比,且有時無法獲得最短路徑。自由空間法的分割需構(gòu)造想象邊界,想象邊界本身具有任意性,于是導(dǎo)致路徑的不確定性。
自由空間法優(yōu)點(diǎn)是不需要使用高線激光特種,單目即可,對運(yùn)算資源消耗也小,缺點(diǎn)是可靠性不高,有時無法得出路徑規(guī)劃,會出現(xiàn)暫時的停滯,或者會繞路,最重要一點(diǎn)是對光線非常敏感,在陽光下的林蔭道,陽光直射攝像頭,低照度環(huán)境,雨雪霧天無法使用。通用用激光特種彌補(bǔ)了部分缺點(diǎn),同時在攝像頭周邊加上了紅外LED,增加對低照度環(huán)境適應(yīng)能力。同時有效距離也比較近,車速通常無法高于每小時100公里。英特爾與Mobileye陣營對這種方法比較青睞。
通用車標(biāo)處的攝像頭應(yīng)該是主攝像頭,很有可能使用了索尼的IMX390CQV傳感器,這是一款1/2.7的CMOS感光元件,有效畫素是245萬,是目前像素最高的車載圖像傳感器,索尼在2017年10月發(fā)布的IMX324圖像傳感器性能更好,是目前全球公認(rèn)性能最佳,有效距離(誤差低于5%的距離)最遠(yuǎn)的圖像傳感器,但在2017年底才有樣品提供,相信通用暫時無緣使用。IMX324是一款1/1.7-type的CMOS圖像傳感器,配備了742萬行業(yè)最高有效分辨率的RCCC濾鏡,在FOV32°鏡頭的幫助下能夠拍攝距離攝像頭160米遠(yuǎn)的路標(biāo),這是專為EyeQ4和EyeQ5開發(fā)的傳感器,價格極高。不過即便是在窄鏡頭(35度以下已經(jīng)屬于窄視角,通常汽車的前視鏡頭是45度)下,有效距離也只有160米,如果是45度,有效距離是150米。而IMX390配合45度視角鏡頭,估計(jì)有效距離是65-75米。而64線激光特種可以做到200米。不過電動車在市區(qū)的速度不高。
通用的雙目攝像頭基線距離大約8厘米,有效距離很短,估計(jì)只有10-12米,應(yīng)該主要用來識別行人和騎車人。利用雙目快速識別行人和騎車人,奔馳和寶馬已經(jīng)在車上大量使用,是一項(xiàng)比較成熟的技術(shù)。這項(xiàng)技術(shù)當(dāng)然和深度學(xué)習(xí)無關(guān),深度學(xué)習(xí)最大的缺點(diǎn)就是消耗大量運(yùn)算資源,效率低下,比較慢。
這種技術(shù)稱為stixels,sticksabovethegroundintheimage。指對圖片中地面以上的柱狀物體進(jìn)行建模,顯然,圖像中的樹木,人,海報之類的物體都可謂柱狀物。
這里所謂的stixels深度信息的底部,就是地面,頂部,就是行人的頭頂可能出現(xiàn)的大概位置。對于圖像中的每一列而言,底部像素,頂部像素,以及未分類物體之間的距離都被估算出來。這種方法的關(guān)鍵在于,利用stereoimage可以直接計(jì)算出stixel,而無需計(jì)算所有的深度信息。在進(jìn)行行人檢測時,對圖像中的地面和stixel進(jìn)行估計(jì),并設(shè)置stixel的高度為1.75m,在2010年就可在CPU上可以達(dá)到135fps的速度。而深度學(xué)習(xí)能做到30fps就需要GTX1080級顯卡了。Stixels的速度至少是深度學(xué)習(xí)的20倍以上。
車頂上的8個攝像頭是一套冗余設(shè)施,即使激光特種和毫米波特種都失效,車輛周圍的360度全景視頻依然可以得到。車內(nèi)后視鏡處的單目也是一套冗余系統(tǒng),就是L2級的AEB緊急剎車系統(tǒng)。
和谷歌無人車一樣,通用的無人車也使用兩套計(jì)算平臺,保證一套失效,另一套可以無間斷接替其運(yùn)行。計(jì)算平臺位于后備箱里,同時也有兩套供電系統(tǒng),主電源通過電動車本身的電池轉(zhuǎn)換為高壓供應(yīng)。注意,通用用了高壓這個詞,如果是英偉達(dá)的DRIVEPX2或其他車載專用計(jì)算平臺,那么應(yīng)該是3到5.5伏的低壓,所以推測通用沒有使用英偉達(dá)的運(yùn)算平臺或其他車載專用計(jì)算平臺,而是很有可能使用了工控機(jī),通常工控機(jī)的輸入電壓是直流24伏,相對5.5伏或車內(nèi)常見的12伏可以算高壓了。如果主電源失效,則啟動備份電源。備份電源將供應(yīng)所有傳感器單元,執(zhí)行器和運(yùn)算單元。
通用無人車的首席工程師AndrewFarah透露第一代無人車的備份電源功率高達(dá)3千瓦。要知道第一代無人車只用了兩個32線激光類、不超過10個毫米波特種,不超過5個攝像頭。但是AndrewFarah未透露最新一代無人車也就是第四代無人車后備電源的功率,不過他堅(jiān)稱功率降低了,估計(jì)可能還要達(dá)到2千瓦??梢钥隙ㄟ@款電動車的續(xù)航要因此減少。
百度則是雙管齊下,一臺是工控機(jī)(使用的是NeousysNuvo-6108GC,這是一款性能強(qiáng)大的X86解構(gòu)工業(yè)控制計(jì)算機(jī));另一臺則是英偉達(dá)用于自動駕駛的DrivePX2。
Nuvo-6108GC是臺灣宸曜科技的工控機(jī),采用華碩GTX1080GPU顯卡,英特爾雙至強(qiáng)E5-2658V312核CPU,1TB2.5寸7200轉(zhuǎn)SATA硬盤(節(jié)約點(diǎn)啊,不用固態(tài))。
推測通用把主要精力都用在算法和傳感器上了,運(yùn)算平臺沒有花費(fèi)多少精力,未來肯定會用低功耗的嵌入式系統(tǒng)來代替,最有可能是兩片或四片瑞薩的R-CARH3并聯(lián)使用,R-CARH3是目前全球運(yùn)算性能最強(qiáng)的車規(guī)級SoC。屆時成本可以大幅度降低。
通用無人車的其他部分,電池,電機(jī)和電控部分都由韓國LG供應(yīng),制動執(zhí)行器是博世的第二代iBooster,ESP也是博世的,轉(zhuǎn)向系統(tǒng)可能是中航集團(tuán)旗下的耐世特NEXTEER供應(yīng),攝像模組可能由加拿大麥格納提供。
摩根士丹利的分析師預(yù)計(jì)通用Bolt無人車的成本高達(dá)25-30萬美元,我預(yù)計(jì)可能沒有那么高,但至少也是15萬美元。顯然這不可能針對普通消費(fèi)者市場。只有出租車、共享出行或網(wǎng)約車市場對車購置成本敏感度不高,對人工成本敏感度很高的領(lǐng)域才是無人車的主要市場。
綜合來看,通用無人車的技術(shù)水平仍然低于谷歌,甚至低于百度,但是通用的商業(yè)化進(jìn)程會遠(yuǎn)比谷歌和百度要快。傳統(tǒng)車企與IT類企業(yè)在無人車領(lǐng)域的技術(shù)差距是快速縮小,而傳統(tǒng)車企的商業(yè)化進(jìn)程只要下定決心,是要比IT類企業(yè)快得多。