熱搜： 佳士科技 irobot 工業(yè)機器人機器人 ABB 機器人產(chǎn)業(yè)聯(lián)盟機械手發(fā)那科機器人展覽碼垛機器人

我國人工智能邁向“多專多能”

日期：2022-09-21 來源：青島財經(jīng)日報評論：0

　　近日，由武漢人工智能研究院、中國科學院自動化研究所和華為技術有限公司聯(lián)合研發(fā)的“紫東太初”多模態(tài)大模型項目獲得了2022世界人工智能大會的最高獎項。

　　中國科學院自動化研究所研究員、武漢人工智能研究院院長王金橋表示，“紫東太初”是全球首個圖、文、音三模態(tài)大模型，開創(chuàng)性地實現(xiàn)了圖像、文本、語音三模態(tài)數(shù)據(jù)間的“統(tǒng)一表示”與“相互生成”，實現(xiàn)了“以圖生音”和“以音生圖”，理解和生成能力更接近人類，為打造多模態(tài)人工智能行業(yè)應用提供創(chuàng)新基礎，向通用

　　人工智能邁出了重要一步。

　　“紫東太初”具備部分類腦特性

　　在王金橋看來，人工智能一路發(fā)展至今，雖然取得了許多突破與進步，但仍存在三大主要局限：首先，人工智能模型的功能單一，一個模型只能解決一個任務；其次，人工智能模型的訓練依賴于大量的樣本，如果缺乏足夠的樣本支撐，訓練也就無從談起。以訓練人臉識別數(shù)據(jù)庫Web-face為例，需要2.6億張圖片才能訓練出一個可用的模型；最后，人工智能模型的泛化能力差，不能應用于廣泛的應用場景。

　　“我們一直以來都在追求如何解決當前人工智能‘一專一用’的問題，基于自監(jiān)督學習的多模態(tài)預訓練模型是當前的一個重要發(fā)展路徑。”王金橋說。

　　自監(jiān)督學習指的是從大規(guī)模的無監(jiān)督數(shù)據(jù)中挖掘隱含的監(jiān)督信息進行訓練，從而得到對下游任務有價值的表征，相比于傳統(tǒng)的深度學習，是更接近人類的學習方式。

　　“能否在同一個維度、同一個空間，面對不同的場景提供同一個多模態(tài)大模型，擺脫‘一專一能’，是實現(xiàn)人工智能通用化的基礎。”王金橋說。“紫東太初”可以將圖像、文本、語音等不同模態(tài)數(shù)據(jù)實現(xiàn)跨模態(tài)的統(tǒng)一表征和學習，突破了當前AI技術局限，具備部分類腦特性，從“一專一能”邁向“多專多能”。

　　中國計算機行業(yè)協(xié)會數(shù)據(jù)安全專業(yè)委員會委員、北京理工大學網(wǎng)絡與安全研究所所長閆懷志指出：“本質(zhì)上，‘以圖生音’和‘以音生圖’仍然是一種基于數(shù)據(jù)的人工智能，但它更接近于人類的理解和思考方式，因此可以被視為從弱人工智能向通用人工智能邁進的重要基礎性工作。”

　　實現(xiàn)三模態(tài)內(nèi)容的統(tǒng)一與重現(xiàn)

　　曾經(jīng)，“以圖生音”和“以音生圖”只是幻想，而如今的“紫東太初”卻讓這兩者成為了現(xiàn)實。“以圖生音”和“以音生圖”究竟是如何實現(xiàn)的？實現(xiàn)圖、文、音三模態(tài)轉(zhuǎn)化的真正關鍵以及底層邏輯是什么？

　　據(jù)悉，“紫東太初”三模態(tài)間的相互轉(zhuǎn)換和生成，其核心原理是視覺、文本、語音不同模態(tài)通過各自編碼器映射到統(tǒng)一語義空間，然后通過多頭自注意力機制學習模態(tài)之間的語義關聯(lián)以及特征對齊，形成多模態(tài)統(tǒng)一知識表示；之后，再利用編碼后的多模態(tài)特征，通過解碼器分別生成文本、圖像和語音。

　　王金橋表示：通俗地說，紫東太初‘就是將形“’式各不相同的三模態(tài)內(nèi)容轉(zhuǎn)化為一個統(tǒng)一的多模態(tài)知識表示，之后再次利用這種知識表示重新生成三模態(tài)內(nèi)容，以此實現(xiàn)‘以圖生音’和‘以音生圖’。”

　　同時，王金橋還表示，“紫東太初”憑借四大突破，有效助力以多模態(tài)認知為核心的通用人工智能發(fā)展。

　　具體來說，一是首次提出多層次、多任務跨模態(tài)自監(jiān)督學習框架，支持從詞條級走向模態(tài)級、樣本級的三級預訓練自監(jiān)督學習方式；二是首次完成弱關聯(lián)多模態(tài)數(shù)據(jù)語義統(tǒng)一表示，減少數(shù)據(jù)收集與清洗代價；三是首次實現(xiàn)多模態(tài)理解與生成任務的統(tǒng)一建模，支持跨模態(tài)檢索、多模態(tài)分類、語音識別、圖像生成等理解與生成任務；四是首次實現(xiàn)無監(jiān)督超越有監(jiān)督方法，基于5%-10%的數(shù)據(jù)標注，實現(xiàn)100%的有監(jiān)督學習效果。

　　打造典型人工智能行業(yè)應用

　　“與單模態(tài)和圖文兩模態(tài)相比，‘紫東太初’采用圖、文、音三模態(tài)大模型，可以靈活支撐全場景的人工智能應用。”王金橋說，“‘紫東太初’還具有在無監(jiān)督情況下多任務聯(lián)合學習以及不同領域數(shù)據(jù)快速遷移的強大能力。引入語音模態(tài)后的多模態(tài)預訓練模型，可實現(xiàn)共性圖文音語義空間表征和利用，并突破性地直接實現(xiàn)三模態(tài)的統(tǒng)一表示，對更廣泛、更多樣的下游任務提供模型基礎支撐。”

　　“目前，我們已經(jīng)整合了產(chǎn)學研用各方面的資源，打造了一系列典型的人工智能行業(yè)應用。”王金橋說。在智能制造領域，“紫東太初”可以有效降低模型訓練對于樣本數(shù)量的依賴，同時提升算法性能。

　　“紫東太初”還與杭州移動共同打造了為杭州文旅代言的智能文旅虛擬人“杭小憶”。“紫東太初”的多模態(tài)對話支持南宋御街場景陶瓷、絲綢、活字印刷、特色小吃等場景化數(shù)據(jù)的增量訓練，助力南宋御街的導游、導購人工智能數(shù)字人實現(xiàn)語音識別、中文對話、語音交互、以音生圖等功能。

聲明：凡資訊來源注明為其他媒體來源的信息，均為轉(zhuǎn)載自其他媒體，并不代表本網(wǎng)站贊同其觀點，也不代表本網(wǎng)站對其真實性負責。您若對該文章內(nèi)容有任何疑問或質(zhì)疑，請立即與中國機器人網(wǎng)(www.baoxianwx.cn)聯(lián)系，本網(wǎng)站將迅速給您回應并做處理。
電話：021-39553798-8007

更多>相關資訊

0 條相關評論

推薦圖文

哈工程水下機器人再奪	里程碑！荊州市首臺機
超維科技精彩亮相電力	機器人行業(yè)“諾貝爾獎
家用清潔機器人行業(yè)首	機器人產(chǎn)業(yè)迎來重要機

推薦資訊

點擊排行

?

• 人工智能！中國聲谷入駐企業(yè)突破1400家	• 北京大學發(fā)布《人工智能人才培養(yǎng)方案》白皮書
• 首個人工智能安全大賽落幕多方探討安全建設新路	• Science:多問蠢問題，能讓人工智能很快變聰明
• “智能”類新增專業(yè)吃香！西南大學人工智能專業(yè)	• 推動人工智能創(chuàng)新發(fā)展！西南大學這個新專業(yè)迎首
• 全球青少年人工智能教育峰會在滬舉行發(fā)布科創(chuàng)少	• 安全可信可靠是人工智能發(fā)展藍圖底色
• 打破“雙十”定律，人工智能大模型加速新藥研發(fā)	• 人工智能創(chuàng)新論壇舉行行業(yè)大咖縱論“元宇宙”

恰佩克獎	機器人高峰論壇	北大機器人	金屬加工在線	AI中國網(wǎng)	機氣林	工博會
趕考網(wǎng)	中國機床網(wǎng)	ITES深圳工業(yè)展	電氣自動化網(wǎng)	高壓電氣網(wǎng)	人工智能機器人	亞洲工業(yè)網(wǎng)
二手設備網(wǎng)	庫卡機器人	中國傳動網(wǎng)	索比光伏網(wǎng)	數(shù)控機床市場網(wǎng)	國家標準化委員會

国产精品久久久久久久小说,国产国产裸模裸模私拍视频,国产精品免费看久久久无码,风流少妇又紧又爽又丰满,国产精品,午夜福利

我國人工智能邁向“多專多能”