Activities
【導(dǎo)讀】2024年7月2日,由中國科學(xué)技術(shù)協(xié)會(huì)、廣西壯族自治區(qū)人民政府主辦,中國自動(dòng)化學(xué)會(huì)承辦的第二十六屆中國科協(xié)年會(huì)通用大模型未來演進(jìn)路線——數(shù)據(jù)、算力、算法論壇在廣西南寧召開。會(huì)議特別邀請歐洲科學(xué)院院士、中國自動(dòng)化學(xué)會(huì)副理事長、華南理工大學(xué)教授陳俊龍,作主題為“新型人工智能技術(shù)助力產(chǎn)業(yè)創(chuàng)新發(fā)展”的報(bào)告,報(bào)告聚焦新型人工智能技術(shù)前沿,探討了人工智能算力的發(fā)展趨勢,數(shù)據(jù)、算法的并行、分布特性和重要性,以及最近興起的生成式人工智能的應(yīng)用和平臺(tái),強(qiáng)調(diào)了數(shù)據(jù)、算力和算法對人工智能發(fā)展的重要性,并提出這些要素的持續(xù)進(jìn)步將推動(dòng)人工智能技術(shù)在各個(gè)領(lǐng)域的廣泛應(yīng)用,催生新技術(shù)、新產(chǎn)業(yè)、新業(yè)態(tài)和支撐經(jīng)濟(jì)高質(zhì)量發(fā)展。
生成式人工智能(Generative AI)的概念自2014年生成對抗網(wǎng)絡(luò)(GAN)提出以來,逐漸得到了廣泛關(guān)注和發(fā)展。與傳統(tǒng)的決策型人工智能模型不同,決策型模型通過數(shù)據(jù)的條件概率分布來進(jìn)行分類決策,而生成式模型則基于數(shù)據(jù)的聯(lián)合概率分布進(jìn)行創(chuàng)作,兩者對比如圖1所示。這一創(chuàng)新不僅僅限于數(shù)據(jù)的決策,還包括數(shù)據(jù)的生成,從而兼具判別與生成的功能,開啟了生成式人工智能的新紀(jì)元。
圖1 決策式AI與生成式AI
一、生成式人工智能的起源與發(fā)展
自2022年12月ChatGPT的推出,生成式人工智能進(jìn)入了爆發(fā)式增長期。生成式AI在智能駕駛、電商應(yīng)用、人臉識(shí)別、情感智能、文本分類等領(lǐng)域展現(xiàn)出強(qiáng)大的替代潛力。這些是得力于2014生成對抗網(wǎng)絡(luò)的誕生,在生成對抗網(wǎng)絡(luò)的研究中,不同組合的GAN模型與擴(kuò)散模型相結(jié)合,取得了諸多成果。例如,通過對一百個(gè)人臉進(jìn)行組合,可以生成出全新且不存在于現(xiàn)實(shí)中的人臉圖像,這一技術(shù)在六七年前就已存在并廣泛應(yīng)用于圖像生成領(lǐng)域。
生成式人工智能在文本與圖像生成方面取得了顯著進(jìn)展。除了傳統(tǒng)的文本生成文本模型,還出現(xiàn)了文本生成圖像的模型,如ChatGPT和文心一言等。此外,文本生成視頻技術(shù)的發(fā)展也日新月異,未來可能會(huì)實(shí)現(xiàn)更復(fù)雜的任務(wù)和動(dòng)作生成。通過描述場景生成視頻,這種技術(shù)在設(shè)計(jì)、電玩場景創(chuàng)建等領(lǐng)域展現(xiàn)出廣闊的應(yīng)用前景。
生成對抗網(wǎng)絡(luò)自2014年問世以來,在圖像處理領(lǐng)域得到了廣泛應(yīng)用。利用生成式模型,可以實(shí)現(xiàn)圖像的超分辨率、去噪、遮擋補(bǔ)全和風(fēng)格遷移等功能。例如,將普通圖像轉(zhuǎn)換為油畫風(fēng)格,或者實(shí)現(xiàn)不同季節(jié)的圖像轉(zhuǎn)換,如圖2所示。這些應(yīng)用大大推動(dòng)了生成對抗網(wǎng)絡(luò)在圖像處理中的發(fā)展,盡管視頻生成的研究直到2023年才逐漸受到關(guān)注。
圖2 人工智能的創(chuàng)作本領(lǐng)
隨著生成式人工智能的發(fā)展,隱私保護(hù)和倫理問題變得尤為重要。例如,短片中顯示詐騙集團(tuán)利用生成式AI技術(shù)進(jìn)行面部替換和聲音生成。如何應(yīng)對這些挑戰(zhàn)成為我們需要關(guān)注的方向。
二、生成式人工智能在各領(lǐng)域的應(yīng)用與挑戰(zhàn)
ChatGPT的誕生標(biāo)志著生成式人工智能的又一里程碑。ChatGPT的發(fā)展經(jīng)歷了從2018年GPT模型的演進(jìn),到2022年加入Chat功能,引發(fā)了生成式人工智能產(chǎn)品的爆發(fā),其發(fā)展歷程如圖3所示。ChatGPT擁有1700多億參數(shù),基于45TB的公共數(shù)據(jù),能夠生成高質(zhì)量的模型。國內(nèi)企業(yè)也紛紛布局生成式人工智能,推出了諸如盤古大模型、紫東太初、文心一言、通義千問、星火等具有國際競爭力的模型。
圖3 ChatGPT發(fā)展歷史
生成式人工智能的出現(xiàn)也改變了市場生態(tài)模式。例如,傳統(tǒng)互聯(lián)網(wǎng)公司如Discord擁有650名員工,年?duì)I收1億美元,而生成式人工智能公司Midjourney僅有11名員工,卻同樣實(shí)現(xiàn)了1億美元的年?duì)I收。這表明未來的小型精簡公司將逐漸嶄露頭角,并在市場中占據(jù)重要地位。
在國內(nèi),盡管企業(yè)如百度、科大訊飛和阿里還未完全開放API供開發(fā)者使用,但未來隨著生成式人工智能技術(shù)的普及,相關(guān)企業(yè)將逐步開放API,促進(jìn)行業(yè)發(fā)展。生成式人工智能在設(shè)計(jì)、繪畫、劇本編寫、特效生成和燈光等創(chuàng)意領(lǐng)域具有廣泛應(yīng)用,極大地降低了制作成本,提高了工作效率。
生成式人工智能不僅可以將輸入內(nèi)容轉(zhuǎn)化為小說、電影和藝術(shù)品,還能通過圖像關(guān)聯(lián)生成不同的敘述。這在國外已經(jīng)得到了廣泛應(yīng)用,而在國內(nèi),國家發(fā)布的大模型數(shù)量也在快速增加,顯示出強(qiáng)大的競爭力,如圖4所示。
圖4 大語言模型樹
生成式人工智能不僅在設(shè)計(jì)和創(chuàng)作領(lǐng)域發(fā)揮重要作用,還在工程領(lǐng)域展現(xiàn)出巨大的潛力。行業(yè)內(nèi)開始探討將大模型分解為小模型,利用行業(yè)數(shù)據(jù)生成行業(yè)專用的小模型。這種垂域大模型的應(yīng)用將極大地推動(dòng)AI for Engineering的發(fā)展,實(shí)現(xiàn)更高效的工程設(shè)計(jì)和應(yīng)用。
在人才方面,人工智能領(lǐng)域的人才需求量巨大,人才的投入和培養(yǎng)至關(guān)重要。計(jì)算平臺(tái)、算力平臺(tái)、數(shù)據(jù)和算法是推動(dòng)人工智能發(fā)展的三大支柱,而人才則是其中最為重要的一環(huán)。
文生任務(wù)和文生行動(dòng)是生成式人工智能的未來應(yīng)用方向之一。例如,英偉達(dá)在發(fā)布會(huì)上展示了利用生成式人工智能訓(xùn)練的機(jī)器人模型,這些機(jī)器人能夠通過觀察人類動(dòng)作進(jìn)行學(xué)習(xí)。迪士尼樂園的人工智能研究院也在進(jìn)行類似的研究,未來我們有望看到機(jī)器人與人類、機(jī)器人與機(jī)器人以及機(jī)器人與數(shù)字人之間的交互。
三、生成式人工智能的未來發(fā)展與挑戰(zhàn)
生成式人工智能的發(fā)展使得文生視頻技術(shù)逐漸成熟。通過文本生成視頻,用戶可以用簡單的文字描述生成高質(zhì)量的視頻內(nèi)容,如圖5所示。例如,一個(gè)女士走在東京街道上的情景可以通過文本描述生成相應(yīng)的視頻。盡管目前生成式人工智能在時(shí)間和空間問題上還存在一些挑戰(zhàn),但隨著技術(shù)的進(jìn)步,這些問題將逐步得到解決。
圖5 文字描述生成視頻內(nèi)容
生成式人工智能將在面向消費(fèi)者的應(yīng)用領(lǐng)域發(fā)揮重要作用,輔助人類進(jìn)行各種任務(wù)。這涉及到自動(dòng)化和智能化的發(fā)展方向,通用人工智能將逐步走向消費(fèi)者,優(yōu)化用戶體驗(yàn),實(shí)現(xiàn)更廣泛的應(yīng)用。
未來,計(jì)算機(jī)和手機(jī)市場將逐漸嵌入生成式人工智能功能。例如,PC市場可能會(huì)加入AIGC功能,只需插入一張卡片即可支持大規(guī)模數(shù)據(jù)計(jì)算。手機(jī)市場同樣將受益于生成式人工智能技術(shù)的發(fā)展,用戶可以在手機(jī)上選擇并應(yīng)用通用大模型。這為國內(nèi)手機(jī)廠商提供了巨大的商機(jī),推動(dòng)智能手機(jī)向更高水平發(fā)展。
AI for Engineering概念強(qiáng)調(diào)行業(yè)知識(shí)的重要性,如圖6所示。頭部企業(yè)的大模型將為中小型企業(yè)提供行業(yè)數(shù)據(jù)支持,生成行業(yè)專用的小模型,推動(dòng)行業(yè)應(yīng)用的發(fā)展。
圖6 AI for Industry and Engineering
除了算法、算力和數(shù)據(jù),人才是推動(dòng)人工智能發(fā)展的關(guān)鍵因素。人工智能領(lǐng)域的人才培養(yǎng)和投入至關(guān)重要,各級(jí)政府和企業(yè)應(yīng)高度重視人才培養(yǎng),以滿足快速發(fā)展的人工智能產(chǎn)業(yè)需求。人才是發(fā)展的第一資源,人工智能對人才的要求程度較高,需要對技術(shù)、商業(yè)有著深刻的理解。
總結(jié)而言,生成式人工智能的發(fā)展已經(jīng)對各個(gè)領(lǐng)域產(chǎn)生了深遠(yuǎn)影響。從設(shè)計(jì)、創(chuàng)作到工程應(yīng)用,生成式人工智能正在改變我們的工作方式和生活方式。隨著技術(shù)的不斷進(jìn)步和應(yīng)用的拓展,生成式人工智能將在未來發(fā)揮更加重要的作用。
(本文根據(jù)作者所作報(bào)告速記整理而成)