大模型熱潮引爆后,短短幾個月,國內就已有數十家公司先后宣布進入大模型領域,然而到了產業落地階段,所有人都是“摸著石頭過河”,缺乏既有的行業經驗、標準和指引,業界關于大模型的疑惑也越來越多。
比如,此前有不少報道稱,大模型是“豪華游戲”,訓練一次千億大模型動輒要幾千萬美元,可是市面上為什么還會出現許多大模型?市場真的需要那么多大模型?企業選擇基礎大模型需要注意哪些問題?
【資料圖】
就相關問題,百度集團副總裁侯震宇和百度智能云副總裁朱勇近日接受媒體采訪,進行了解答和探討。
大模型門檻高不高,要看是哪一類玩家
朱勇告訴記者,大模型的“門檻”是一個相對概念,因為整個大模型領域有三大類“玩家”。
第一類負責從零開始建造“基礎大模型”,這一類肯定屬于“豪華游戲”,無論是對數據、算力還是人才的要求都非常高。
比如在算力方面,需要大量投入大量高性能GPU芯片。在數據方面,需要“相當于幾百萬個人一生的閱讀量”的數據量以及高質量的標注數據。除此之外還需要大量精通算法、有豐富AI實踐經驗的人才。“就好比是廚師做菜,不同的廚師用同樣的原材料做出來的菜,口味都不一樣”朱勇說。
百度智能云事業群副總裁 朱勇
第二類“玩家”負責做“行業大模型”,門檻相比第一類大大降低,行業大模型主要是在“基礎大模型”的基礎之上,通過注入特定行業、領域或企業數據,進行針對性的定制化,讓它能更好的服務好特定行業場景。
第三類“玩家”負責在這兩類大模型之上開發應用,服務最終用戶,門檻較低,也是機會最多的。
簡而言之,建基礎大模型門檻最高,建行業大模型次之,用大模型門檻不高。
大模型沒有絕對好壞,適合的才是最好的
侯震宇認為,大模型不能在單一維度上評價好壞,正如我們很難說某一款暢銷的手機就一定適合某些人在某些場景下。他說:“盡管在大模型剛剛推出時,很多人經常像考它一樣去問一些非常有意思的問題。但事實上,在真正嚴肅的企業級環境里面,不太會有這樣的場景,企業應該針對企業自己的場景去選擇自己更適合的大模型。”
具體到實操層面,侯震宇建議企業重點關注三個方面:模型效果、大模型開發平臺提供的工具鏈,以及迭代速度。
在模型效果上,企業應該去測試、評估大模型在實際場景中能發揮出的能力和價值;
在開發平臺方面,企業要看提供模型服務的平臺是否有完整的開發工具鏈,這將決定企業是否能很方便地去基于模型去開發上層應用,把大模型的能力“植入”到企業場景中來。
在迭代速度方面,只有選擇一個在持續快速進步的大模型,才能更好地支撐企業應用和解決方案的快速迭代,滿足當下及未來的需求。
百度集團副總裁 侯震宇
談到國內大模型在國際上的技術水平時,侯震宇認為中國的大模型技術放在整個全球來看,還是比較領先的。他說:“中國的大模型一定能發展起來也一定會發展起來。”
B端市場不需要那么多基礎大模型,找準角色很重要
當記者問到“大模型領域是否出現泡沫,B端市場真的需要那么多大模型嗎?”侯震宇說,如果從終局來看,市場上的確不需要那么多的基礎大模型,純粹做基礎大模型最后只有少數玩家能留下來,但目前大模型領域還屬于起步階段,任何一個新的技術階段都難免有一定泡沫,應該予以理解,因為市場需求是真實的。
他表示,大公司會比創業公司更適合做基礎大模型,因為基礎大模型不僅需要足夠多的算力、足夠多和質量好的數據,以及大量算法和AI人才的長時間積累,還需要一個易用的平臺來管理、調度好各種資源,大公司會有更好的環境和資源去訓練大模型,并且支持后續的模型快速迭代。
朱勇補充,盡管市場未必需要那么多基礎大模型,但是一定會有很多行業大模型和定制化需求,這些都可以在基礎大模型之上,用企業自己的數據去做針對性的定制化開發,這樣可以兼顧成本和企業需求。相比如何去建一個大模型,企業應該更多地去思考如何用上大模型,用好大模型。
“現在每一家公司都應該去考慮如何用大模型,就像當年智能手機出來以后,我們每一家公司都應該去擁抱移動時代帶來的變化。但是行業里的每一家企業是否都需要自己去做一個大模型?我覺得不一定。”侯震宇說,大模型本身的特點就已經決定了,企業拿自己數據在一個基礎大模型上做微調,一樣可以獲得非常好的AI效果。
他建議,大模型從業者應該量力而行,根據自己能力、場景在大模型的產業鏈中,找準最合適自己的角色,找到自己最短的落地路徑。