Activities
導(dǎo)讀:2023年10月20-21日,以“智能涌現(xiàn) 生成未來(lái)”為主題的第二十五屆中國(guó)科協(xié)年會(huì)通用人工智能產(chǎn)業(yè)創(chuàng)新發(fā)展論壇在安徽省合肥市成功召開(kāi)。歐洲科學(xué)院院士、中國(guó)自動(dòng)化學(xué)會(huì)副理事長(zhǎng)、華南理工大學(xué)教授陳俊龍受邀出席并作題為“人工智能的發(fā)展趨勢(shì)與AIGC應(yīng)用的探討”的主題報(bào)告。報(bào)告聚焦工業(yè)智能與智能系統(tǒng)前沿,探討了人工智能賦能制造業(yè)的關(guān)鍵科學(xué)問(wèn)題和重點(diǎn)推進(jìn)內(nèi)容,指出人工智能作為制造業(yè)數(shù)字化轉(zhuǎn)型的新生產(chǎn)工具,正催生AI for Engineering這一工程研發(fā)新范式。同時(shí)進(jìn)一步探討了工業(yè)智能的內(nèi)涵,并提出了工業(yè)智能前沿研究的重點(diǎn)內(nèi)容和總體目標(biāo),即:從信息感知本質(zhì)、信息理解深度和系統(tǒng)行為決策出發(fā),開(kāi)展跨時(shí)空感知與統(tǒng)一表征、多模態(tài)信息可解釋泛化認(rèn)知和人機(jī)共融決策與動(dòng)態(tài)博弈的基礎(chǔ)理論與關(guān)鍵技術(shù)研究,實(shí)現(xiàn)制造過(guò)程高端化、綠色化、智能化運(yùn)行。
以下為報(bào)告全文。
自2009年以來(lái),國(guó)家在物聯(lián)網(wǎng)、云計(jì)算、大數(shù)據(jù)和人工智能領(lǐng)域取得了顯著進(jìn)展。這些進(jìn)展得益于算力、數(shù)據(jù)和算法模型的不斷支持,以及深度學(xué)習(xí)技術(shù)的興起。此外,在2008年和2009年間,軟件和硬件領(lǐng)域也經(jīng)歷了重大的發(fā)展,促成了近期通用人工智能的興起。
一、算力
最近,國(guó)家在通用人工智能(AIGC)領(lǐng)域的發(fā)展受益于算法、算力和數(shù)據(jù)的顯著提升。為了提供企業(yè)強(qiáng)有力的算力資源,政府在2022年統(tǒng)籌啟動(dòng)了東數(shù)西算工程。這個(gè)工程概念類(lèi)似于早期的南水北調(diào)和西電東送工程,旨在建立8個(gè)關(guān)鍵樞紐點(diǎn),分布于長(zhǎng)三角、珠三角、寧夏、貴州、內(nèi)蒙等地,這些樞紐點(diǎn)也 配置了數(shù)據(jù)中心的重要角色。目前東數(shù)西算工程正在進(jìn)行大規(guī)模建設(shè)。這些舉措不僅在土建工程、軟件工程和信息技術(shù)等領(lǐng)域對(duì)國(guó)家產(chǎn)業(yè)鏈的發(fā)展產(chǎn)生了積極作用,而且為能源利用和雙碳減排工程貢獻(xiàn)了一份力量,并滿(mǎn)足了中小企業(yè)對(duì)大規(guī)模數(shù)據(jù)資源的需求。合肥市也在呼應(yīng)該計(jì)劃在組建算力上扮演著非常重要角色。
英偉達(dá)公司今年5月宣布了"Hopper"計(jì)劃,旨在分析當(dāng)前的GPU技術(shù)。該計(jì)劃旨在推動(dòng)GPU技術(shù)的發(fā)展,以滿(mǎn)足不斷增長(zhǎng)的計(jì)算需求,尤其是在人工智能和科學(xué)計(jì)算領(lǐng)域。計(jì)劃的一部分包括推出基于新架構(gòu)的GPU產(chǎn)品,以提供更高的性能和效能。這將有助于滿(mǎn)足日益增長(zhǎng)的計(jì)算要求,幫助研究人員、科學(xué)家和工程師在各個(gè)領(lǐng)域開(kāi)展創(chuàng)新性的工作。該計(jì)劃啟動(dòng)時(shí),國(guó)內(nèi)尚未受到美國(guó)的限制,但它給我們帶來(lái)了一系列未來(lái)發(fā)展的思考。回顧早期CPU技術(shù),特別是在大型語(yǔ)言模型的訓(xùn)練方面,以ChatGPT為例,實(shí)現(xiàn)這一目標(biāo)需要巨大的計(jì)算資源。然而,借助GPU計(jì)算中心資源,成本約為40萬(wàn)美元,能源消耗也僅相當(dāng)于傳統(tǒng)CPU的約1/8。若投入1000萬(wàn)美元,我們能夠?qū)崿F(xiàn)4倍LLM(Large Language Model)大語(yǔ)言模型的規(guī)模。進(jìn)一步考慮到能源消耗,我們甚至可以實(shí)現(xiàn)高達(dá)150倍LLM的容量,如圖1所示。
圖1 CPU/GPU資源對(duì)比
這引發(fā)了深刻思考,若我們擁有足夠的計(jì)算能力和資源,大型語(yǔ)言模型規(guī)模有可能增加到150倍。隨著算力和數(shù)據(jù)更深度的協(xié)同作用,未來(lái)通用人工智能預(yù)計(jì)會(huì)變得更加智能,這意味著通用人工智能將在各行各業(yè)中發(fā)揮作用,為各種問(wèn)題提供解決方案。
目前國(guó)內(nèi)正在積極研究除了GPU之外的其他算力支持大型語(yǔ)言模型的方案,其中包括MPU(混合處理器單元),NPU(神經(jīng)元處理單元),和TPU(張量處理單元),如圖2所示。最近,研究人員開(kāi)始探討如何利用量子計(jì)算來(lái)克服DPU(深度處理單元)所面臨的局限,這引起了廣泛的討論。谷歌很早之前就在進(jìn)行TPU和MPU的研究,而現(xiàn)在,阿里巴巴、寒武紀(jì)等公司也在積極研究這些新的計(jì)算架構(gòu),這些努力有望突破目前GPU所面臨的限制。
圖2 CPU、GPU、TPU方案
二、數(shù)據(jù)
數(shù)據(jù)在大型語(yǔ)言模型中起著關(guān)鍵作用,一個(gè)大型語(yǔ)言模型的性能和智能程度與訓(xùn)練數(shù)據(jù)的質(zhì)量密切相關(guān)。因此,數(shù)據(jù)的重要性不可忽視。國(guó)家在2021年底便開(kāi)始建立數(shù)據(jù)聚集和管理系統(tǒng),不僅著重管理整個(gè)數(shù)據(jù)生命周期,包括數(shù)據(jù)來(lái)源、存儲(chǔ)、處理、交換和傳輸,并且實(shí)施數(shù)據(jù)分析等級(jí)的分類(lèi)處理,以確保數(shù)據(jù)在未來(lái)如何進(jìn)行去標(biāo)識(shí)化和去敏感化處理,如圖3所示。這一舉措強(qiáng)調(diào)了數(shù)據(jù)的關(guān)鍵性,以確保數(shù)據(jù)在各個(gè)方面的安全和有效管理。
圖3 數(shù)據(jù)安全生命周期
同時(shí),國(guó)家在各個(gè)省市紛紛設(shè)立數(shù)據(jù)交易所,如在廣東和深圳同時(shí)建立了數(shù)據(jù)交易所,這些交易所是由省市共同支持和發(fā)展的。未來(lái),各行各業(yè)的數(shù)據(jù)可以像煤氣、水電一樣進(jìn)行交易。這意味著在模型訓(xùn)練時(shí),不再局限于使用公共數(shù)據(jù),而可以利用交易的數(shù)據(jù)進(jìn)行模型訓(xùn)練,這是國(guó)家在數(shù)據(jù)領(lǐng)域取得的重要突破,將為人工智能的發(fā)展提供更多的數(shù)據(jù)資源和可能性。
三、模型與算法
大型模型的概念首次出現(xiàn)在2015年和2016年,由于生成式模型尚未嶄露頭角,所以當(dāng)時(shí)還沒(méi)有引起廣泛的關(guān)注。當(dāng)時(shí)OpenAI組成的GPT-3在當(dāng)時(shí)尚未加入Chat功能,當(dāng)時(shí)也沒(méi)有類(lèi)似文心一言、通義千問(wèn),訊飛的星火等大模型。從今年開(kāi)始這些模型開(kāi)始逐漸涌現(xiàn),如圖4所示。大型模型的主要特點(diǎn)之一是其擁有千億級(jí)參數(shù)的規(guī)模,同時(shí)希望能夠通過(guò)標(biāo)注的小樣本來(lái)進(jìn)行模型訓(xùn)練。
圖4 國(guó)內(nèi)外語(yǔ)言大模型
最近,網(wǎng)絡(luò)上已經(jīng)發(fā)布了大約80個(gè)具有超過(guò)10億參數(shù)的模型,然而,目前只有11個(gè)模型通過(guò)了國(guó)家的認(rèn)證 。這表明不同機(jī)構(gòu)對(duì)于這些大型模型的價(jià)值評(píng)估各有不同??傮w而言,中美兩國(guó)的大型模型已經(jīng)占據(jù)了全球的80%份額,這引發(fā)了國(guó)內(nèi)各行各業(yè)都希望構(gòu)建自己的大型模型的熱情。然而,通用大型模型的構(gòu)建相對(duì)困難,因?yàn)樗枰嫶蟮挠?jì)算資源支持。因此,國(guó)內(nèi)正在進(jìn)行所謂的“百模大戰(zhàn)”,旨在建立各個(gè)領(lǐng)域的小型專(zhuān)用大型模型,以滿(mǎn)足不同行業(yè)的需求。這凸顯了大型模型在國(guó)內(nèi)的廣泛應(yīng)用和重要性。
當(dāng)前最主要的問(wèn)題國(guó)內(nèi)大型模型的計(jì)算能力仍然高度依賴(lài)國(guó)外的生態(tài)系統(tǒng),包括依賴(lài)微軟、英偉達(dá)等公司的產(chǎn)品以及算子庫(kù)。盡管?chē)?guó)內(nèi)擁有華為的昇騰系統(tǒng)算子庫(kù),但仍然需要與用戶(hù)合作開(kāi)發(fā)。這個(gè)問(wèn)題涉及的領(lǐng)域非常廣泛,最主要的挑戰(zhàn)是如何改變國(guó)內(nèi)顯卡的生態(tài)系統(tǒng)。國(guó)外的生態(tài)系統(tǒng)已經(jīng)形成了全球性的格局,而要改變國(guó)內(nèi)生產(chǎn)的顯卡的生態(tài)系統(tǒng)相對(duì)更具挑戰(zhàn)性。國(guó)內(nèi)擁有兩三家顯卡生產(chǎn)商,如曙光、寒武紀(jì)等,但由于缺乏與生態(tài)系統(tǒng)的深入了解,難以推廣和普及。未來(lái),這些企業(yè)需要積極探討如何構(gòu)建生態(tài)系統(tǒng),以改變國(guó)際局勢(shì)并打破依賴(lài)國(guó)外生態(tài)系統(tǒng)的現(xiàn)狀。
在構(gòu)建大型模型時(shí),需要考慮兩個(gè)關(guān)鍵要素。首先,數(shù)據(jù)的規(guī)模對(duì)于模型構(gòu)建速度至關(guān)重要,大型數(shù)據(jù)集需要更多的時(shí)間來(lái)建立模型,所以快速構(gòu)建準(zhǔn)確有效用的模型至關(guān)重要。其次,也應(yīng)考慮在模型構(gòu)建后如何快速應(yīng)用增量數(shù)據(jù)進(jìn)行更新。這方面的挑戰(zhàn)在于涉及大量數(shù)據(jù),因此更新過(guò)程可能相對(duì)復(fù)雜。目前,我們正在探索邊緣端的實(shí)時(shí)模型更新方法,使得在模型訓(xùn)練完成后,客戶(hù)端可以實(shí)現(xiàn)隨時(shí)更新,而不必將模型返回到原始大型模型進(jìn)行批量更新。寬度學(xué)習(xí)在這一領(lǐng)域發(fā)揮了重要作用,尤其是對(duì)于實(shí)時(shí)增量數(shù)據(jù)的更新。
圖5 寬度學(xué)習(xí)系統(tǒng)
在算力和模型都達(dá)到要求滿(mǎn)足時(shí),算力冷卻便成為了一個(gè)難題?,F(xiàn)在,算力冷卻系統(tǒng)采用了多種方法,包括風(fēng)冷系統(tǒng)、液冷系統(tǒng)以及浸沒(méi)冷卻。在浸沒(méi)冷卻方面,我們建立了一個(gè)模型,以調(diào)整化學(xué)成分,將冷卻效率最大化。這種方法可以使PUE值降至1.07,低于國(guó)家規(guī)定的水平,并且此種冷卻形態(tài)需要更少的空間。相比于傳統(tǒng)的大型計(jì)算機(jī)柜,這種方法在效率和空間利用方面都有顯著的優(yōu)勢(shì)。
圖6 基于浸沒(méi)式液冷技術(shù)的高性能算力解決方案
四、AIGC對(duì)公司生態(tài)的影響
近期人工智能研究公司OpenAI推出的聊天機(jī)器人模型CHAT-GPT不斷出圈,繼2019年向OpenAI注資10億美元之后,微軟與OpenAI的合作進(jìn)入第三階段。據(jù)Semafor引知情人士報(bào)道,微軟以290億美元估值,向OpenAI 投資100億美元,一切均指向人工智能模型的新范式“生成式AI模型(Generative Model)”。決策式AI模型(Discriminant Model)是根據(jù)已有數(shù)據(jù)進(jìn)行分析、判斷、預(yù)測(cè),典型應(yīng)用為內(nèi)容的智能推薦(短視頻)、自動(dòng)駕駛等;而生成式AI更強(qiáng)調(diào)學(xué)習(xí)歸納后進(jìn)行演繹創(chuàng)造,生成全新的內(nèi)容,本質(zhì)是對(duì)生產(chǎn)力的大幅度提升和創(chuàng)造,已催生了營(yíng)銷(xiāo)、設(shè)計(jì)、建筑和內(nèi)容領(lǐng)域的創(chuàng)造性工作,并開(kāi)始在生命科學(xué)、醫(yī)療、制造、材料科學(xué)、媒體、娛樂(lè)、汽車(chē)、航空航天進(jìn)行初步應(yīng)用,為各個(gè)領(lǐng)域帶來(lái)巨大的生產(chǎn)力提升。
在AIGC方面,來(lái)談?wù)剶?shù)字人及人機(jī)交互的應(yīng)用。目前,為解決人體大健康領(lǐng)域的問(wèn)題,我們獲批的教育部的健康智能和數(shù)字 平行人工程中心正在探討在數(shù)字世界與真實(shí)的物理世界里人機(jī)交互的問(wèn)題 。。目前已經(jīng)初步開(kāi)發(fā)了數(shù)字人,使其能夠進(jìn)行對(duì)話(huà)并相互了解,數(shù)字人之間也可以互相交互,而且數(shù)字人可以在現(xiàn)實(shí)空間與真實(shí)人進(jìn)行互動(dòng)。我們的團(tuán)隊(duì)正在致力于情感識(shí)別及在數(shù)字世界與物理世界人體健康監(jiān)控及交互的研究。。
生成式人工智能對(duì)公司生態(tài)的影響最大的是互聯(lián)網(wǎng)公司。現(xiàn)在,如果公司能夠熟練使用生成式人工智能來(lái)編寫(xiě)代碼和開(kāi)發(fā)嵌入式應(yīng)用,未來(lái)的公司將變得更小而更精致。這將帶來(lái)更多的盈利機(jī)會(huì),使員工有機(jī)會(huì)成為創(chuàng)業(yè)者或老板。他們可以迅速將生成式人工智能整合到公司中,以實(shí)現(xiàn)更高效的嵌入式應(yīng)用。目前,國(guó)內(nèi)在生成式人工智能方面仍有很大的發(fā)展空間,各種小型科學(xué)家和企業(yè)都有機(jī)會(huì)嵌入到人工智能平臺(tái)應(yīng)用中,未來(lái)的創(chuàng)新和發(fā)展會(huì)涌現(xiàn)更多機(jī)會(huì)。
從產(chǎn)業(yè)價(jià)值角度來(lái)看,生成式人工智能可以迅速分為上游、中游和下游三個(gè)方向。上游產(chǎn)業(yè)涉及基礎(chǔ)建設(shè),下游產(chǎn)業(yè)則涉及應(yīng)用,而中游產(chǎn)業(yè)在各個(gè)行業(yè)中起到樞紐作用。初創(chuàng)公司在這一領(lǐng)域?qū)儆谥行⌒停磥?lái)可能成為龍頭企業(yè),這將產(chǎn)生巨大的產(chǎn)業(yè)價(jià)值。在實(shí)際生產(chǎn)應(yīng)用中,還沒(méi)有大規(guī)模采用生成式人工智能的情況,主要是因?yàn)榇蟛糠謶?yīng)用仍然依賴(lài)傳統(tǒng)的專(zhuān)用小型大模型,這些模型使用相對(duì)較小的計(jì)算資源進(jìn)行訓(xùn)練。未來(lái),生成式人工智能將在各個(gè)領(lǐng)域得到更廣泛的應(yīng)用,這取決于我們擁有的算力和數(shù)據(jù)基礎(chǔ)。
ChatGPT是AIGC目前最典型及最有名氣的平臺(tái)產(chǎn)品。此類(lèi)的平臺(tái)它具有正面和負(fù)面兩面的影響。一方面它擴(kuò)大了知識(shí)的傳播途徑,提供了便捷的信息獲取方式,個(gè)性化的服務(wù),以及自動(dòng)化客戶(hù)支持,同時(shí)還有創(chuàng)新應(yīng)用的潛力。另一方面,其具有不準(zhǔn)確信息和偏見(jiàn)傳播的風(fēng)險(xiǎn),可能對(duì)隱私構(gòu)成威脅,引發(fā)失業(yè)風(fēng)險(xiǎn),以及可能被濫用。解決這些問(wèn)題需要審查數(shù)據(jù)來(lái)源、開(kāi)發(fā)偏見(jiàn)識(shí)別和修正技術(shù),強(qiáng)化隱私法規(guī),以及進(jìn)行社會(huì)倫理和道德教育??偠灾珻hatGPT和AIGC類(lèi)似技術(shù)在未來(lái)將繼續(xù)發(fā)揮重要作用,但需謹(jǐn)慎管理,以最大程度地提升積極影響,降低其潛在負(fù)面的影響。