《科創(chuàng)板日?qǐng)?bào)》4月12日訊(記者 曾樂(lè))今年以來(lái),AI大模型火爆全球,其落地應(yīng)用頻頻引發(fā)市場(chǎng)關(guān)注。而大數(shù)據(jù)、超算中心的大規(guī)模應(yīng)用,也是自動(dòng)駕駛的AI基礎(chǔ)設(shè)施。AI大模型在自動(dòng)駕駛感知、認(rèn)知等領(lǐng)域同樣發(fā)揮著重要作用。
(資料圖)
4月11日,在毫末智行第八屆HAOMO AI DAY上,毫末智行發(fā)布了業(yè)內(nèi)首個(gè)自動(dòng)駕駛生成式大模型毫末DriveGPT雪湖·海若。
據(jù)毫末智行CEO顧維灝介紹,毫末DriveGPT雪湖·海若通過(guò)引入駕駛數(shù)據(jù)建立RLHF(人類反饋強(qiáng)化學(xué)習(xí))技術(shù),對(duì)自動(dòng)駕駛認(rèn)知決策模型進(jìn)行持續(xù)優(yōu)化,現(xiàn)階段主要用于解決自動(dòng)駕駛的認(rèn)知決策問(wèn)題,終極目標(biāo)是實(shí)現(xiàn)端到端自動(dòng)駕駛。
《科創(chuàng)板日?qǐng)?bào)》記者了解到,截至目前,毫末DriveGPT雪湖·海若實(shí)現(xiàn)了模型架構(gòu)與參數(shù)規(guī)模的升級(jí),參數(shù)規(guī)模達(dá)1200億,預(yù)訓(xùn)練階段引入4000萬(wàn)公里量產(chǎn)車駕駛數(shù)據(jù),RLHF階段引入5萬(wàn)段人工精選的困難場(chǎng)景接管Clips。
具體來(lái)看,DriveGPT雪湖·海若的底層模型采用GPT(Generative Pre-trained Transformer)生成式預(yù)訓(xùn)練大模型,與ChatGPT使用自然語(yǔ)言進(jìn)行輸入與輸出不同。
DriveGPT雪湖·海若輸入是感知融合后的文本序列,輸出是自動(dòng)駕駛場(chǎng)景文本序列,即:將自動(dòng)駕駛場(chǎng)景形成“Drive Language”,最終完成自車的決策規(guī)控、障礙物預(yù)測(cè)以及決策邏輯鏈的輸出等任務(wù)。
從實(shí)現(xiàn)過(guò)程來(lái)看,DriveGPT雪湖·海若先在預(yù)訓(xùn)練階段通過(guò)引入量產(chǎn)駕駛數(shù)據(jù)、訓(xùn)練初始模型,通過(guò)引入駕駛接管Clips數(shù)據(jù)完成反饋模型(Reward Model)的訓(xùn)練,再通過(guò)強(qiáng)化學(xué)習(xí)的方式,使用反饋模型去不斷優(yōu)化迭代初始模型,形成對(duì)自動(dòng)駕駛認(rèn)知決策模型的持續(xù)優(yōu)化。
同時(shí),DriveGPT雪湖·海若根據(jù)輸入端提示語(yǔ),以及毫末CSS自動(dòng)駕駛場(chǎng)景庫(kù)的決策樣本去訓(xùn)練模型,讓模型學(xué)習(xí)推理關(guān)系,從而將完整駕駛策略拆分為自動(dòng)駕駛場(chǎng)景的動(dòng)態(tài)識(shí)別過(guò)程,完成可理解、可解釋的推理邏輯鏈生成。
毫末智行CEO顧維灝表示,毫末DriveGPT雪湖·海若將率先探索智能駕駛、駕駛場(chǎng)景識(shí)別、駕駛行為驗(yàn)證、困難場(chǎng)景脫困四大應(yīng)用場(chǎng)景。“首先會(huì)開(kāi)放智能駕駛、駕駛場(chǎng)景識(shí)別。”
“目前,毫末在使用數(shù)據(jù)過(guò)程中,逐步建立起一套基于4D Clips駕駛場(chǎng)景識(shí)別方案,頗具性價(jià)比。未來(lái),毫末將圖像幀及4D Clips場(chǎng)景識(shí)別服務(wù)逐步向行業(yè)開(kāi)放使用,這將進(jìn)一步降低行業(yè)使用數(shù)據(jù)的成本、提高數(shù)據(jù)質(zhì)量。”顧維灝如是說(shuō)。
與此同時(shí),顧維灝在現(xiàn)場(chǎng)宣布,毫末DriveGPT雪湖·海若智能駕駛能力首發(fā)落地車型為新摩卡DHT-PHEV。
顧維灝還宣布,毫末DriveGPT雪湖·海若的所有能力對(duì)生態(tài)伙伴開(kāi)放,首批伙伴合作伙伴包括:北京交通大學(xué)計(jì)算機(jī)與信息技術(shù)學(xué)院、火山引擎、華為云、高通、京東科技、四維圖新、魏牌新能源、英特爾。
需要注意的是,顧維灝在接受媒體群訪時(shí)也坦言:“此次發(fā)布毫末DriveGPT雪湖·海若,是一個(gè)新的實(shí)踐開(kāi)始。從當(dāng)前科技實(shí)踐來(lái)看,參數(shù)規(guī)模和效果有很大相關(guān)性。我們現(xiàn)在主要應(yīng)用在認(rèn)知層面,隨著這個(gè)能力應(yīng)用的時(shí)間越長(zhǎng)、不斷增加數(shù)據(jù)使用使得參數(shù)規(guī)模越大,產(chǎn)品能力也會(huì)更為完善、豐富。”
“毫末DriveGPT雪湖·海若這種GPT的方式,最核心在于具有了邏輯推理鏈、具備很多語(yǔ)料。換而言之,可以把思考過(guò)程反向轉(zhuǎn)化為語(yǔ)言,這會(huì)給用戶對(duì)于自動(dòng)駕駛的信任感將有很大提升。”毫末智行技術(shù)副總裁艾銳在接受媒體群訪時(shí)說(shuō)道。
當(dāng)前,新一代人工智能正助力自動(dòng)駕駛實(shí)現(xiàn)更為廣泛的應(yīng)用。
在中科院雄安創(chuàng)新研究院認(rèn)知智能實(shí)驗(yàn)室副主任、雄安新區(qū)數(shù)字交通實(shí)驗(yàn)室副主任黃武陵看來(lái),“自動(dòng)駕駛技術(shù)正進(jìn)入以數(shù)據(jù)和知識(shí)雙驅(qū)動(dòng)的多模態(tài)感知和認(rèn)知理解為代表的新階段。”
黃武陵認(rèn)為,“大模型對(duì)算力要求,也將通過(guò)智能網(wǎng)聯(lián)不斷得到車載計(jì)算平臺(tái)算力、路側(cè)端邊計(jì)算和云端分布式算力的支撐。同時(shí),大模型對(duì)數(shù)據(jù)高要求可通過(guò)數(shù)據(jù)和知識(shí)雙驅(qū)動(dòng)方法,通過(guò)數(shù)據(jù)混合與人工增強(qiáng)等方法來(lái)解決;同時(shí),通過(guò)從數(shù)據(jù)中提煉知識(shí),降低模型數(shù)據(jù)需求、節(jié)省模型訓(xùn)練算力,節(jié)約大量資源。”