日前,2023年世界人工智能大會(WAIC)主論壇科學前沿全體會議在上海舉辦。多位全球人工智能及相關(guān)交叉領(lǐng)域頂級科學家、高校教授及業(yè)內(nèi)外人士齊聚一堂,共同探討全球化視野下的“通用人工智能與科學未來”。
(潘潔 攝)
(資料圖片)
上海市副市長劉多在致辭中指出,面向未來,上海將搶抓通用人工智能發(fā)展機遇,發(fā)揮城市功能、技術(shù)積累、產(chǎn)業(yè)集聚、應用場景、人力資源等綜合優(yōu)勢,進一步加強人工智能基礎(chǔ)理論和關(guān)鍵技術(shù)研究,著力提升自主創(chuàng)新能力,打造具有全球影響力的創(chuàng)新高地和世界級產(chǎn)業(yè)集群。
科技部戰(zhàn)略規(guī)劃司司長梁穎達表示,展望未來,我們將聚焦人工智能發(fā)展和治理等重大議題,與國際業(yè)界同仁共推發(fā)展、共護安全、共享成果。
開啟通用大模型新時代
會議期間,上海AI實驗室與商湯科技聯(lián)合香港中文大學、復旦大學、上海交通大學及清華大學發(fā)布全新升級的“書生通用大模型體系”(簡稱“書生大模型”),包括“書生·多模態(tài)”“書生·浦語”和“書生·天際”等三大基礎(chǔ)模型,以及首個面向大模型研發(fā)與應用的全鏈條開源體系。
目前,“書生大模型”在130多個評測中性能達世界領(lǐng)先或先進水平。其中,“書生·多模態(tài)”無縫整合了語言、圖像、視頻等多種模態(tài),首次實現(xiàn)通過自然語言定義視覺任務,并具有多模態(tài)交互和跨模態(tài)生成能力;升級后的“書生·浦語”為國內(nèi)首個正式發(fā)布的支持8K語境長度的千億參數(shù)級語言大模型;“書生·天際”則是全球首個城市級NeRF實景三維大模型,具備千億參數(shù),在全球首次實現(xiàn)對100平方公里城市實景進行4K高精度建模及編輯。
在全面升級的同時,書生·浦語也正式開源了一個70億參數(shù)的輕量級版本InternLM-7B,以及貫穿數(shù)據(jù)、預訓練、微調(diào)、部署和評測五大環(huán)節(jié)的全鏈條工具體系。
共商AI過去與未來
論壇現(xiàn)場,兩位AI頂級學者對人工智能研究的前沿課題進行了回溯與展望。
圖靈獎得主、美國科學院院士、美國工程院院士、谷歌杰出工程師David A. Patterson(大衛(wèi)·帕特森),香港科技大學首席副校長、英國皇家工程院院士郭毅可分別帶來了主題演講。
David A. Patterson發(fā)表了題為《A decade of Machine Learning Accelerators: Lessons Learned and Carbon Footprint》的視頻演講。他提到,當前訓練某一模型需要產(chǎn)生大量碳排放,如果進一步提升模型準確度,排放數(shù)字可能會更大。而在未來,我們有辦法讓機器學習的能耗和碳排放降低。研究人員有望從模型、硬件、數(shù)據(jù)中心能效、數(shù)據(jù)中心位置四方面協(xié)同著手,大幅降低機器學習的能耗與碳排放。
在主題為《The Human Use of Human Bing: University Education in the AI Era(人有人的用處:人工智能時代的大學教育)》的演講中,郭毅可表示,生成式人工智能對教育的影響是根本性的,人工智能賦能的時代,教師及學習者都更需要創(chuàng)造力和批判思維能力。“我相信人有人的用處,我覺得聰明的我們應該用我們創(chuàng)作的機器培養(yǎng)更聰明的人,而這些人又去創(chuàng)造更聰明的機器,更聰明的機器培養(yǎng)更聰明的人,這是一個健康的循環(huán)。”?
AI如何保障人類社會的可持續(xù)和良性發(fā)展
隨著模型規(guī)模的不斷擴大和性能的不斷提升,大模型已成為推動人機交互革命的重要力量。由上海AI實驗室林達華教授主持,加拿大工程院外籍院士、IEEE/IAPR/CAAI Fellow、HiDream.ai創(chuàng)始人兼首席執(zhí)行官梅濤、清華大學教授唐杰、復旦大學教授邱錫鵬、普林斯頓大學教授王夢迪、南洋理工大學助理教授潘新鋼、微軟研究院高級研究員楊健偉以及上海AI實驗室青年科學家戴勃展開了以“大模型驅(qū)動的交互新范式”為主題的圓桌討論。
(潘潔 攝)
當下,絕大部分大語言模型依舊是Transformer模型,這基本也成為標準結(jié)構(gòu)。“Transformer的成功有必然因素,首先它的模型容量非常適合GPU,因為它是GPU誕生之后形成的模型,所以考慮設(shè)計模型時基于現(xiàn)在的GPU架構(gòu),非常適合通過GPU把規(guī)模擴大,這是其成功的主要原因,包括它的容量要足夠大。”邱錫鵬表示,這同樣帶來一個問題,包括算力消耗,它需要非常大的計算量,比如把模型規(guī)模進一步擴大時,可能就難以承受了。
“未來應該會出現(xiàn)深的架構(gòu),而且成本會非常低,這種架構(gòu)長什么樣,還不確定,基本可以借鑒人的記憶機制,現(xiàn)在的Transformer沒有狀態(tài)的,所以引入記憶之類的是可以大幅地減少計算量。”大模型這波浪潮,很大程度上影響或改變了世界交互的方式。潘新鋼則表示,交互的方式也取決于硬件技術(shù),蘋果前不久發(fā)布新的VR設(shè)備,對于3D建模師來說將是新的創(chuàng)作方式,大模型也可以和新興硬件交互方式結(jié)合,讓設(shè)計師們更好地進行創(chuàng)作。
“大模型擅長模仿人的推理和創(chuàng)作方式,但它從0-1的創(chuàng)新能力目前達不到人的水平。”潘新鋼同時表示,人可以從沒有文字創(chuàng)造出文字,可以從有文字再發(fā)展出三次工業(yè)革命,但目前來說,大模型在模仿人進行機械或推理任務時,沒有從0-1的創(chuàng)作能力,“大模型可以替代人的機械式勞動,比如你有一個想法,把它變成電影草圖,大模型就可以幫你做,但如何想一個好的甚至數(shù)據(jù)中沒有出現(xiàn)過的想法,這反而體現(xiàn)了設(shè)計師的可貴或任何利用AI作為工具的人的更加重要的能力。”
人工智能如何賦能科學研究日益成為科學家們關(guān)心的話題。大會圍繞“AI for Earth”召集全球地球科學專家展開討論。對話由上海AI實驗室教授歐陽萬里主持,聚焦于AI技術(shù)在地球系統(tǒng)基礎(chǔ)研究的最新技術(shù)進展和成果,以及AI大模型在地球科學基礎(chǔ)研究領(lǐng)域的挑戰(zhàn)和發(fā)展趨勢。美國工程院院士、中國科學技術(shù)大學講席教授張捷、國家氣象中心副主任代刊、歐洲中期天氣預報中心副總干事兼預報部主任Florian Pappenberger、慕尼黑工業(yè)大學教授Niklas Boers、北京大學長聘副教授林金泰及上海AI實驗室青年科學家白磊共同開展了主題為“AI for Earth: Building a Sustainable Future”的圓桌對話。