近日,一位國外游戲設(shè)計(jì)師的作品《太空歌劇院》奪得了美國科羅拉多州博覽會(huì)藝術(shù)比賽數(shù)字類別的一等獎(jiǎng)。據(jù)了解該畫作完全由AI繪圖軟件根據(jù)文字指令生成,是不折不扣的AI畫作,這樣的結(jié)果引來了不少傳統(tǒng)藝術(shù)家的指責(zé),一時(shí)間,關(guān)于AI作畫是否是作弊、人類藝術(shù)消亡的討論引爆網(wǎng)絡(luò)。

AI作畫正是大量AI模型訓(xùn)練后的技術(shù)能力輸出的方向之一。Gartner發(fā)布的2022年AI技術(shù)成熟度曲線顯示:生成式AI、AI大模型等技術(shù)在萌芽2年多后已快速步入期望膨脹階段,生成式AI更是被MIT科技評(píng)論列入“2022年全球十大突破性技術(shù)”、是Gartner“2022年的12項(xiàng)頂級(jí)戰(zhàn)略技術(shù)趨勢(shì)”之一。
什么是生成式AI?
2020年,生成式AI首次出現(xiàn)在Gartner技術(shù)成熟度曲線上。根據(jù)Gartner官網(wǎng),預(yù)計(jì)到2025年,生成式AI將占所有生成數(shù)據(jù)的10%。
生成式AI是指利用現(xiàn)有文本、音頻文件或圖像等創(chuàng)建新內(nèi)容的技術(shù)。生成式AI可從其數(shù)據(jù)中學(xué)習(xí)內(nèi)容或?qū)ο螅⑦\(yùn)用數(shù)據(jù)生成全新的、完全原創(chuàng)的、逼真的工件,留下與訓(xùn)練數(shù)據(jù)相似的特征,而不是簡單的重復(fù)。生成式AI有潛力創(chuàng)造新形式的創(chuàng)意內(nèi)容,例如視頻,并可加快從醫(yī)學(xué)到產(chǎn)品創(chuàng)造等領(lǐng)域的研發(fā)周期。
企業(yè)可以通過兩種方式使用生成式AI:一是與業(yè)務(wù)部門一起增強(qiáng)當(dāng)前的創(chuàng)新工作流程,開發(fā)自動(dòng)化以幫助人類更好地執(zhí)行創(chuàng)造性任務(wù)。例如游戲設(shè)計(jì)師可以利用生成式AI來創(chuàng)建地下城,突出他們喜歡和不喜歡的內(nèi)容。二是充當(dāng)業(yè)務(wù)流程的重要部分,生成式AI可以在幾乎沒有人為參與的情況下生產(chǎn)無數(shù)的創(chuàng)意作品。它只需要設(shè)置上下文,結(jié)果將獨(dú)立生成。
與此前廣受爭(zhēng)議的深度偽造Deepfake相似,生成式對(duì)抗網(wǎng)絡(luò)(GAN)與變分自動(dòng)編碼器(VAE)也都是生成式AI的關(guān)鍵技術(shù)。其中,生成式對(duì)抗網(wǎng)絡(luò)更廣泛地用于圖像處理,而變分自動(dòng)編碼器則更多地用于信息壓縮。
生成式對(duì)抗網(wǎng)絡(luò)本質(zhì)上是一種深度學(xué)習(xí)模型,在原理上,生成式對(duì)抗網(wǎng)絡(luò)使用兩個(gè)神經(jīng)網(wǎng)絡(luò)相互對(duì)立,一個(gè)生成器和一個(gè)判別器。生成器或生成網(wǎng)絡(luò),負(fù)責(zé)生成類似于源數(shù)據(jù)的新數(shù)據(jù)或內(nèi)容,判別器或判別網(wǎng)絡(luò)則負(fù)責(zé)區(qū)分源數(shù)據(jù)和生成數(shù)據(jù)。經(jīng)過交替周期訓(xùn)練,雙方在對(duì)抗中不斷完善。生成器不斷學(xué)習(xí)生成更逼真的數(shù)據(jù),判別器則更善于區(qū)分假數(shù)據(jù)和真實(shí)數(shù)據(jù)。變分自動(dòng)編碼器可以為具有不同機(jī)制的各種任務(wù)創(chuàng)建更有效的分類引擎。它們的核心建立在組成的神經(jīng)網(wǎng)絡(luò)的一個(gè)自動(dòng)編碼器和一個(gè)自動(dòng)解碼器上。編碼器優(yōu)化表示數(shù)據(jù)的更有效方式,而解碼器優(yōu)化重新生成原始數(shù)據(jù)集的更有效方式。傳統(tǒng)上,自動(dòng)編碼器技術(shù)清理數(shù)據(jù)、改進(jìn)預(yù)測(cè)分析、壓縮數(shù)據(jù)并為其他算法降低數(shù)據(jù)集的維數(shù)。變分自動(dòng)編碼器更進(jìn)一步,以盡量減少原始信號(hào)的誤差與重建誤差。
生成式AI的巨大潛力
IDC報(bào)告預(yù)測(cè),2025年全球AI市場(chǎng)規(guī)模將達(dá)到2218.7億美元。其中,中國約占全球總規(guī)模8.3%,位列單體國家第二?!吨袊鳤I數(shù)字商業(yè)產(chǎn)業(yè)展望2021-2025》報(bào)告認(rèn)為,從中國AI應(yīng)用表現(xiàn)看,以生成式AI和組合式AI為代表的人工智能新興技術(shù)將成長為中國數(shù)字商業(yè)產(chǎn)業(yè)鏈的關(guān)鍵應(yīng)用技術(shù)棧。
生成式AI是最引人注目和最強(qiáng)大的AI技術(shù)之一,在各行各業(yè)有著廣泛的使用案例。
例如在工業(yè)設(shè)計(jì)領(lǐng)域,企業(yè)可以將不同的限制條件提供給AI,由AI設(shè)計(jì)出一些不同的方案以供選擇。

在媒體內(nèi)容生成方面,生成式AI可以處理并生成圖片、音頻、視頻、文件、語言等不同類型數(shù)據(jù)。比如界面原型設(shè)計(jì)工具Pencil可以將企業(yè)上傳的字體、顏色、LOGO、圖片等素材生成可用于營銷或廣告用途的海報(bào)或視頻等內(nèi)容。
此外,生成式AI還可用于增強(qiáng)式編程,通過計(jì)算機(jī)或機(jī)器輔助程序員寫代碼,當(dāng)前微軟、Github、OpenAI都在使用這種技術(shù)。
以多模態(tài)形式呈現(xiàn)的數(shù)字人、虛擬偶像等也是生成式AI的應(yīng)用方向。數(shù)字主播的聲音、表情、動(dòng)作是通過背后的大模型實(shí)時(shí)生成并融合呈現(xiàn)的。
以上種種都可以歸結(jié)為數(shù)字產(chǎn)品,此外,生成式AI還為陷入困境的企業(yè)數(shù)據(jù)使用打開了新的可能性,即在真實(shí)數(shù)據(jù)的基礎(chǔ)上制作合成的數(shù)據(jù)。雖然單條生成數(shù)據(jù)可能面目全非但其數(shù)據(jù)集的整體分布,包括方差、均值都與原始數(shù)據(jù)十分接近。即其在保留數(shù)據(jù)價(jià)值的同時(shí)將涉及數(shù)據(jù)安全的隱私部分隱去。
合成數(shù)據(jù)有望提高數(shù)據(jù)資源的豐富度,以合成數(shù)據(jù)輔助AI訓(xùn)練也已成為國際通用的手段,它可以為工業(yè)機(jī)器人或自動(dòng)駕駛車輛設(shè)計(jì)數(shù)百萬個(gè)不同的訓(xùn)練場(chǎng)景。國內(nèi)商業(yè)公司中,支付寶基于實(shí)物建模技術(shù)與渲染技術(shù)提出應(yīng)用于視覺零售的3D合成方案,也是運(yùn)用合成數(shù)據(jù)有效降低了模型訓(xùn)練中的數(shù)據(jù)成本,避免了人工標(biāo)注數(shù)據(jù)帶來的不可靠性。
Unity總裁約翰·里奇蒂洛認(rèn)為合成數(shù)據(jù)可以無偏差地訓(xùn)練人工智能的算法,人們可以隨時(shí)退回到之前的過程查看和分析算法。這在真實(shí)世界數(shù)據(jù)強(qiáng)化的過程中,需要幾天幾周幾個(gè)月才能做到,但是用合成數(shù)據(jù)幾乎即刻就能完成。
Gartner研究總監(jiān)閆斌認(rèn)為,合成數(shù)據(jù)在未來企業(yè)的應(yīng)用中存在較大的發(fā)展空間,且與全球市場(chǎng)相比,國內(nèi)的合成數(shù)據(jù)廠商較少,機(jī)會(huì)更多。合成數(shù)據(jù)可實(shí)現(xiàn)不同企業(yè)間數(shù)據(jù)的匯集,并應(yīng)用于更加安全的第三方分析工作、廠商選型、測(cè)試以及一些云上的應(yīng)用,以及在脫敏和合規(guī)基礎(chǔ)上的數(shù)據(jù)變現(xiàn),盡可能地保留數(shù)據(jù)價(jià)值。
邏輯與安全性尚待提升
當(dāng)前,生成式AI與合成數(shù)據(jù)發(fā)展趨勢(shì)迅猛,被視為有望掀起人工智能2.0的浪潮。但距離大規(guī)模商用還有很多困難需要克服?,F(xiàn)有的生成式AI的應(yīng)用還存在一些局限,比如在常識(shí)、邏輯和推理;復(fù)雜上下文的長期記憶以及對(duì)于數(shù)據(jù)的依賴性和效率方面。
人工智能專家認(rèn)為,生成式AI在未來還需關(guān)注以下問題:
合成數(shù)據(jù)的評(píng)估問題。在全面應(yīng)用合成數(shù)據(jù)集之前,需要充分研究合成數(shù)據(jù)集與真實(shí)數(shù)據(jù)集的差異,從而避免應(yīng)用合成數(shù)據(jù)集帶來的偏差。如何評(píng)估合成數(shù)據(jù)集與真實(shí)數(shù)據(jù)集的差異仍是一個(gè)亟待解決的問題。
合成數(shù)據(jù)仍存在“非自然數(shù)據(jù)”的問題。目前大多合成數(shù)據(jù)技術(shù)基于統(tǒng)計(jì)機(jī)器學(xué)習(xí)的方法,由于經(jīng)典統(tǒng)計(jì)學(xué)只關(guān)注了數(shù)據(jù)中蘊(yùn)含的相關(guān)性,而忽視了因果性,因此有可能會(huì)生成不合邏輯的數(shù)據(jù)。例如合成圖像中出現(xiàn)的具有異常背景的圖像,這類數(shù)據(jù)被稱為“非自然數(shù)據(jù)”,它對(duì)智能算法的魯棒性和可靠性將造成何種影響目前仍然未知??坍嬘绊懙倪吔绮⑻嵩缢伎紤?yīng)對(duì)措施將會(huì)是合成數(shù)據(jù)能否進(jìn)入風(fēng)險(xiǎn)敏感領(lǐng)域的關(guān)鍵。
合成數(shù)據(jù)的安全性問題,主要包括生成對(duì)抗網(wǎng)絡(luò)等模型的穩(wěn)定性問題會(huì)帶來預(yù)期之外的生成結(jié)果、對(duì)于原始訓(xùn)練樣本的記憶容易導(dǎo)致隱私泄露以及被不法分子用于詐騙等風(fēng)險(xiǎn)。
且在實(shí)際應(yīng)用中,合成數(shù)據(jù)也存在一些無法模擬的場(chǎng)景,也不適用于人臉檢測(cè)、物體識(shí)別等人工標(biāo)注成本較低的任務(wù),對(duì)于低成本實(shí)現(xiàn)動(dòng)態(tài)場(chǎng)景模擬等技術(shù)難點(diǎn)還需進(jìn)一步攻克。