Activities
近年來(lái),人工智能理論、方法和技術(shù)快速發(fā)展,尤其是深度學(xué)習(xí)技術(shù)帶動(dòng)了智能任務(wù)的性能快速提升和在社會(huì)多個(gè)領(lǐng)域的成功應(yīng)用。由于實(shí)際應(yīng)用場(chǎng)景數(shù)據(jù)動(dòng)態(tài)變化、多模態(tài)協(xié)同的特點(diǎn),多模態(tài)人工智能成為人工智能理論方法發(fā)展的重要方向。多模態(tài)人工智能面向復(fù)雜動(dòng)態(tài)多模態(tài)場(chǎng)景的數(shù)據(jù)理解、學(xué)習(xí)和推理,涉及自然語(yǔ)言處理、計(jì)算機(jī)視覺(jué)、模式識(shí)別、語(yǔ)音識(shí)別和多模態(tài)融合等領(lǐng)域。最近,人工智能大模型的發(fā)展和應(yīng)用再人工智能領(lǐng)域產(chǎn)生了巨大的影響,也將在多模態(tài)人工智能中發(fā)揮關(guān)鍵作用。
為了給本領(lǐng)域研究者、技術(shù)開(kāi)發(fā)人員和研究生介紹多模態(tài)人工智能前沿理論方法和最新進(jìn)展,中國(guó)自動(dòng)化學(xué)會(huì)模式識(shí)別與機(jī)器智能專業(yè)委員會(huì)主辦這次前沿技術(shù)講習(xí)班。講習(xí)班于2023年9月22日-24日在昆明舉辦,由中國(guó)科學(xué)院自動(dòng)化研究所劉成林研究員、華南理工大學(xué)金連文教授、云南大學(xué)信息學(xué)院張學(xué)杰教授和陶大鵬教授擔(dān)任學(xué)術(shù)主任,邀請(qǐng)了多名人工智能領(lǐng)域的知名專家作報(bào)告,使學(xué)員在了解學(xué)科熱點(diǎn)和基礎(chǔ)理論方法、提高學(xué)術(shù)水平的同時(shí),增進(jìn)與多模態(tài)人工智能領(lǐng)域頂尖學(xué)者之間的學(xué)術(shù)交流。
主辦單位:中國(guó)自動(dòng)化學(xué)會(huì)模式識(shí)別與機(jī)器智能專委會(huì)
承辦單位:云南大學(xué)信息學(xué)院
協(xié)辦單位:云南云上云大數(shù)據(jù)產(chǎn)業(yè)發(fā)展有限公司
時(shí)間:2023年9月22號(hào)-24號(hào)
地點(diǎn):云南省昆明市呈貢區(qū)南亞豪生酒店·南亞廳
注冊(cè)費(fèi)包括講課資料和3天會(huì)議期間午餐。
注冊(cè)鏈接:
https://www.cacpaper.com/register/76/user/preRegist
注冊(cè)二維碼:
簡(jiǎn)介:
簡(jiǎn)介:
金連文,華南理工大學(xué)二級(jí)教授,兼任廣東省圖像圖形學(xué)學(xué)會(huì)理事長(zhǎng)、中國(guó)圖像圖形學(xué)學(xué)會(huì)(CSIG)常務(wù)理事、CSIG文檔圖像分析與識(shí)別專委會(huì)主任、中國(guó)自動(dòng)化學(xué)會(huì)模式識(shí)別與機(jī)器智能專委會(huì)常委委員等職。主要研究領(lǐng)域?yàn)槿斯ぶ悄?、?jì)算機(jī)視覺(jué)、文字識(shí)別、文檔圖像理解等,在重要學(xué)術(shù)期刊及國(guó)際會(huì)議上發(fā)表學(xué)術(shù)論文300余篇,其中SCI Q1區(qū)+CCF A類論文100余篇,Google Scholar論文被引用數(shù)12000余次,H-Index 58,獲得授權(quán)發(fā)明專利70余項(xiàng)目。獲省部級(jí)科技獎(jiǎng)5項(xiàng)(其中一等獎(jiǎng)2項(xiàng),二等獎(jiǎng)3項(xiàng));指導(dǎo)學(xué)生參加權(quán)威國(guó)際國(guó)內(nèi)學(xué)術(shù)競(jìng)賽榮獲冠軍20余次。
簡(jiǎn)介:
報(bào)告題目:
語(yǔ)言基礎(chǔ)模型的重要特性
報(bào)告摘要:
近年來(lái)以BERT、GPT為代表的預(yù)訓(xùn)練語(yǔ)言基礎(chǔ)模型,使人工智能技術(shù)進(jìn)入“預(yù)訓(xùn)練-微調(diào)”的全新范式,特別是最近ChatGPT引爆了全社會(huì)對(duì)基礎(chǔ)模型技術(shù)的關(guān)注。本報(bào)告重點(diǎn)介紹語(yǔ)言基礎(chǔ)模型的基本原理,在智能能力方面體現(xiàn)的強(qiáng)大通用特性,在模型框架、微調(diào)適配、推理計(jì)算等方面體現(xiàn)的模塊化計(jì)算特性,以及在多模態(tài)、工具學(xué)習(xí)、群體智能、安全性等方面體現(xiàn)的全新智能特性,并探討大模型未來(lái)的研發(fā)應(yīng)用范式。報(bào)告人簡(jiǎn)介:
報(bào)告題目:
視覺(jué)大模型:自監(jiān)督預(yù)訓(xùn)練以及在文心·CV大模型中的實(shí)踐
報(bào)告摘要:
本報(bào)告首先回顧計(jì)算機(jī)視覺(jué)領(lǐng)域里的自監(jiān)督預(yù)訓(xùn)練算法最近幾年的進(jìn)展,包括對(duì)比學(xué)習(xí)和圖像掩碼建模等。其次,介紹文心·CV大模型中的自監(jiān)督表征學(xué)習(xí)算法Context Autoencoder(CAE)和基于預(yù)訓(xùn)練的目標(biāo)檢測(cè)算法Group DETR等,同時(shí),從學(xué)習(xí)物體部件的角度,給出幾個(gè)典型的自監(jiān)督預(yù)訓(xùn)練算法(BEiT、MAE、CAE、MoCo v3及DINO)的特點(diǎn)(TMLR)。再次,講述基于CAE和Group DETR的工業(yè)視覺(jué)大模型、OCR文字識(shí)別大模型(MaskOCR)、人體大模型等。最后,分享圖文對(duì)比預(yù)訓(xùn)練大模型在自動(dòng)駕駛數(shù)據(jù)挖掘中的應(yīng)用和基于多任務(wù)學(xué)習(xí)的交通感知大模型。
報(bào)告人簡(jiǎn)介:
報(bào)告題目:
多模態(tài)預(yù)訓(xùn)練的研究進(jìn)展回顧與展望
報(bào)告摘要:
近年來(lái),從預(yù)訓(xùn)練模型到預(yù)訓(xùn)練大模型,從文本、音頻、視覺(jué)等單模態(tài)大模型,到現(xiàn)在的圖文、圖文音等多模態(tài)預(yù)訓(xùn)練大模型,無(wú)論在學(xué)術(shù)界還是企業(yè)界預(yù)訓(xùn)練模型都得到了廣泛關(guān)注與爆發(fā)式發(fā)展。多模態(tài)預(yù)訓(xùn)練通過(guò)聯(lián)合圖文音等多模態(tài)內(nèi)容進(jìn)行模型學(xué)習(xí),其發(fā)展在多模態(tài)理解、搜索、推薦、問(wèn)答,語(yǔ)音識(shí)別與合成,人機(jī)交互等應(yīng)用領(lǐng)域中具有潛力巨大的市場(chǎng)價(jià)值。本報(bào)告主要包含三方面內(nèi)容:分析多模態(tài)預(yù)訓(xùn)練模型的重要性與必要性;回顧當(dāng)前多模態(tài)預(yù)訓(xùn)練的最新研究進(jìn)展;多模態(tài)預(yù)訓(xùn)練模型主要應(yīng)用場(chǎng)景與未來(lái)展望。
報(bào)告人簡(jiǎn)介:
劉靜,中科院自動(dòng)化所研究員/博導(dǎo),中國(guó)科學(xué)院大學(xué)崗位教授。研究方向多模態(tài)分析與理解,紫東太初大模型。曾獲中國(guó)電子學(xué)會(huì)自然科學(xué)一等獎(jiǎng),圖像圖形學(xué)會(huì)科學(xué)技術(shù)二等獎(jiǎng),2022年世界人工智能大會(huì)“卓越人工智能引領(lǐng)者獎(jiǎng)SAIL”。承擔(dān)或參與多項(xiàng)國(guó)家自然科學(xué)基金項(xiàng)目、國(guó)家973課題、國(guó)家基金重大研究計(jì)劃、國(guó)家重點(diǎn)研發(fā)等。已發(fā)表高水平學(xué)術(shù)論文150余篇,谷歌學(xué)術(shù)引用12000+次,SCI他引次數(shù)5000+次,其中有三篇被ESI列為Top1%高被引論文。在視覺(jué)計(jì)算相關(guān)領(lǐng)域的多項(xiàng)國(guó)際學(xué)術(shù)競(jìng)賽中榮獲冠軍10+項(xiàng)。
報(bào)告題目:
從ChatGPT到國(guó)產(chǎn)多模態(tài)基礎(chǔ)大模型
報(bào)告摘要:
隨著深度學(xué)習(xí)技術(shù)的快速發(fā)展,ChatGPT作為自然語(yǔ)言處理領(lǐng)域的重要突破,引起了廣泛關(guān)注。本次探討ChatGPT在自然語(yǔ)言處理領(lǐng)域中的重要性以及其所具有的優(yōu)秀特性,繼而引出國(guó)產(chǎn)多模態(tài)基礎(chǔ)大模型的研發(fā)意義,以及如何通過(guò)結(jié)合多模態(tài)數(shù)據(jù)和深度學(xué)習(xí)技術(shù)來(lái)實(shí)現(xiàn)新型國(guó)產(chǎn)化基礎(chǔ)模型的構(gòu)建。具體來(lái)說(shuō),將討論多模態(tài)數(shù)據(jù)的處理方法、模型構(gòu)建的關(guān)鍵技術(shù)以及如何實(shí)現(xiàn)緊致化部署等相關(guān)技術(shù)點(diǎn)。本講座的研究成果將為解決多模態(tài)大模型的部署難題和提高模型性能和效率提供借鑒和參考。
報(bào)告人簡(jiǎn)介:
報(bào)告題目:
擴(kuò)散模型與視覺(jué)內(nèi)容生產(chǎn)
報(bào)告摘要:
擴(kuò)散模型與AIGC 摘要:擴(kuò)散概率模型逐步地對(duì)先驗(yàn)分布去噪恢復(fù)數(shù)據(jù)分布。目前,這類模型在數(shù)據(jù)合成質(zhì)量、采樣的多樣性和數(shù)據(jù)密度估計(jì)等指標(biāo)下取得了超越 VAE、GAN、FLOW 等經(jīng)典深度生成模型的結(jié)果,也部署于諸多的圖像、跨模態(tài)大規(guī)模生成模型。本次報(bào)告會(huì)介紹擴(kuò)散概率模型的基本原理、加速推斷算法、大規(guī)模訓(xùn)練和可控生成等AIGC應(yīng)用的前沿進(jìn)展。報(bào)告人簡(jiǎn)介:
報(bào)告題目:
高性能視覺(jué)目標(biāo)檢測(cè)分割和跟蹤
報(bào)告摘要:
視覺(jué)目標(biāo)檢測(cè)分割和跟蹤技術(shù)是計(jì)算機(jī)視覺(jué)中的基礎(chǔ)任務(wù),具有重要的應(yīng)用價(jià)值。本次報(bào)告將圍繞視覺(jué)目標(biāo)檢測(cè)分割和跟蹤技術(shù),梳理近年來(lái)的技術(shù)發(fā)展路徑,并從預(yù)訓(xùn)練大模型、開(kāi)放場(chǎng)景感知、模型輕量化部署等方向做前沿技術(shù)介紹。
報(bào)告人簡(jiǎn)介:
報(bào)告題目:
視覺(jué)場(chǎng)景理解與推理問(wèn)答
報(bào)告摘要:
近年來(lái),以Transformer為核心的神經(jīng)網(wǎng)絡(luò)架構(gòu)快速發(fā)展,網(wǎng)絡(luò)規(guī)模日益龐大,并以此為基礎(chǔ)推動(dòng)了無(wú)監(jiān)督/自監(jiān)督學(xué)習(xí)技術(shù)的跳躍式發(fā)展,逐步形成一套被稱為大模型或者基礎(chǔ)模型的技術(shù)范式。本報(bào)告將梳理這套基礎(chǔ)模型技術(shù)在視覺(jué)場(chǎng)景和推理問(wèn)答中的應(yīng)用。
報(bào)告人簡(jiǎn)介:
林倞,中山大學(xué)計(jì)算機(jī)學(xué)院教授/博導(dǎo),國(guó)際模式識(shí)別學(xué)會(huì)會(huì)士(IAPR Fellow),英國(guó)工程技術(shù)學(xué)會(huì)會(huì)士(IET Fellow)。長(zhǎng)期從事計(jì)算機(jī)視覺(jué)、機(jī)器學(xué)習(xí)及智能機(jī)器人領(lǐng)域的應(yīng)用基礎(chǔ)研究,承擔(dān)國(guó)家2030科技創(chuàng)新重大項(xiàng)目。在國(guó)際頂級(jí)學(xué)術(shù)期刊和會(huì)議發(fā)表論文300余篇,論文被引用累計(jì)3萬(wàn)次;獲權(quán)威期刊Pattern Recognition年度最佳論文獎(jiǎng),多媒體計(jì)算旗艦會(huì)議ICME最佳論文鉆石獎(jiǎng),計(jì)算機(jī)視覺(jué)旗艦會(huì)議ICCV最佳論文獎(jiǎng)提名;獲中國(guó)圖像圖形學(xué)會(huì)科學(xué)技術(shù)一等獎(jiǎng)、吳文俊人工智能自然科學(xué)獎(jiǎng),省級(jí)自然科學(xué)一等獎(jiǎng)。中國(guó)科學(xué)院自動(dòng)化研究所研究員
報(bào)告題目:
魯棒自適應(yīng)模式識(shí)別
報(bào)告摘要:
模式識(shí)別是人工智能領(lǐng)域的核心研究方向。傳統(tǒng)的模式識(shí)別和機(jī)器學(xué)習(xí)假設(shè)閉合類別集、獨(dú)立同分布、大數(shù)據(jù)訓(xùn)練。然而在開(kāi)放環(huán)境下,包括深度學(xué)習(xí)在內(nèi)的已有方法面臨一系列新的技術(shù)挑戰(zhàn)。尤其是,識(shí)別對(duì)象從閉合世界擴(kuò)展到了開(kāi)放世界,對(duì)新類別模式、異常和噪聲模式的建模與處理成為困難,由此產(chǎn)生了開(kāi)放集識(shí)別、置信度估計(jì)、持續(xù)學(xué)習(xí)等大量研究工作。本報(bào)告對(duì)開(kāi)放環(huán)境模式識(shí)別的研究問(wèn)題進(jìn)行分析,并專門針對(duì)開(kāi)放魯棒性和類別增量學(xué)習(xí)進(jìn)行深入討論。主要內(nèi)容包括:開(kāi)放環(huán)境魯棒模式識(shí)別的研究問(wèn)題,開(kāi)放集識(shí)別的模型和算法,深度模型置信度校準(zhǔn),類別增量學(xué)習(xí),開(kāi)放環(huán)境模式識(shí)別的未來(lái)發(fā)展趨勢(shì)。
報(bào)告人簡(jiǎn)介:
聯(lián)系人:李老師
聯(lián)系電話:18403433440
電子郵箱: [email protected]