2022年末,ChatGPT橫空出世,讓人工智能產(chǎn)業(yè)再起漣漪。
人工智能(Artificial Intelligence,簡(jiǎn)稱“AI”)誕生于1956年,至今已六十余年。在漫長(zhǎng)的歲月中,一些新技術(shù)或新方法的出現(xiàn),給AI產(chǎn)業(yè)帶來過樂觀浪潮,但隨之而出現(xiàn)的,則是數(shù)次AI寒冬。
如同任何新興事物一樣,人工智能的發(fā)展沒有一蹴而就,而是歷經(jīng)坎坷和挫折。直到近十年,得益于深度學(xué)習(xí)算法的突破,以及算力提升和大數(shù)據(jù)的積累,人工智能才真正迎來從實(shí)驗(yàn)室研究走向產(chǎn)業(yè)實(shí)踐的黃金時(shí)代。
2016年,谷歌AlphaGo與人類圍棋冠軍李世石進(jìn)行的人機(jī)大戰(zhàn),讓AI走向社會(huì)舞臺(tái)中央,同時(shí),也推動(dòng)了AI商業(yè)浪潮的來臨。
過去五年,人工智能與千行百業(yè)加速融合,其價(jià)值在很多場(chǎng)景得到釋放,并催生出一大批AI公司或團(tuán)隊(duì)。然而,在產(chǎn)業(yè)實(shí)踐過程中,AI也面臨新的瓶頸:解決單一場(chǎng)景問題,AI的能力毋庸置疑,但如何復(fù)用解決更多場(chǎng)景的問題,成為很多AI公司盈利的掣肘。
而AI工程化,是解決這一問題的重要手段。此前,Gartner已連續(xù)兩年把AI工程列為年度戰(zhàn)略技術(shù)趨勢(shì)之一。在Gartner看來,AI工程化是AI大規(guī)模發(fā)展的必經(jīng)之路。因?yàn)槿魏涡袠I(yè)或企業(yè),只要有場(chǎng)景、數(shù)據(jù)和算力,都可以落地AI應(yīng)用,但落地效率、周期會(huì)遠(yuǎn)超預(yù)期。
因此,AI要成為企業(yè)的生產(chǎn)力,就必須以工程化的技術(shù)來解決模型開發(fā)、訓(xùn)練、預(yù)測(cè)等全鏈路生命周期的問題。所以在2022年,AI工程化成為AI行業(yè)的一個(gè)關(guān)鍵詞。
ChatGPT走入大眾
以ChatGPT為例,它其實(shí)也是AI工程化的產(chǎn)物。一位AI領(lǐng)域?qū)<腋嬖V21世紀(jì)經(jīng)濟(jì)報(bào)道記者,AI工程化的過程包括需求分析、模型設(shè)計(jì)、模型訓(xùn)練、模型部署等環(huán)節(jié)。
其中,在需求分析階段,需要明確人工智能技術(shù)應(yīng)用的目標(biāo)和需求。比如OpenAI開發(fā)ChatGPT,其目的就是滿足人們對(duì)自然語(yǔ)言處理技術(shù)的需求,希望通過自然語(yǔ)言交互的方式給人們提供幫助。
而在模型設(shè)計(jì)階段,需要根據(jù)需求分析的結(jié)果,設(shè)計(jì)合適的模型來解決問題。就像ChatGPT其實(shí)是一種被稱Assistant的大型語(yǔ)言模型,為了讓它能夠理解和回答用戶的問題,并生成用戶可讀的回復(fù),OpenAI選擇用Transformer深度學(xué)習(xí)模型進(jìn)行訓(xùn)練。
在訓(xùn)練過程中,則需要通過訓(xùn)練大量的文本數(shù)據(jù),讓模型學(xué)習(xí)如何對(duì)話。它需要先識(shí)別用戶輸入文本中的語(yǔ)法、語(yǔ)義和結(jié)構(gòu),更難的則是要學(xué)會(huì)如何生成更像是人類回復(fù)的文本。
“ChatGPT能實(shí)現(xiàn)目前這樣自然的語(yǔ)言交互,與過去幾年AI產(chǎn)業(yè)在算法、算力、數(shù)據(jù)等方面的不斷突破密切相關(guān),但光有技術(shù)上的創(chuàng)新還不夠,人們能夠如此便捷的體驗(yàn)到ChatGPT,則是AI工程化的功勞”,該AI領(lǐng)域?qū)<冶硎尽?/div>
其實(shí)早在2020年,OpenAI就推出過大型語(yǔ)言生成模型GPT-3(Generative Pre-training Transformer 3),其訓(xùn)練參數(shù)量達(dá)到1750,在當(dāng)時(shí),這已是世界之最。
雖然都是使用深度學(xué)習(xí)技術(shù)開發(fā)的大型語(yǔ)言模型,但GPT-3比ChatGPT要更大,訓(xùn)練數(shù)據(jù)也更多,所以GPT-3的能力要強(qiáng)于ChatGPT。然而,GPT-3的能力只能通過API的形式開放給外界,這也讓很多普通用戶無法體驗(yàn)到GPT-3的強(qiáng)大。
而ChatGPT在定位上,就是一款To C產(chǎn)品,上線僅5天,便吸引了超過100萬用戶。而且它給社會(huì)帶來的震撼,要遠(yuǎn)超AlphaGo,畢竟相比只能遠(yuǎn)觀AlphaGo,現(xiàn)在人們可以直接與ChatGPT對(duì)話,感受AI的魔力。
對(duì)業(yè)界來說,ChatGPT的出現(xiàn),更是讓人看到了AI工程能力的又一次進(jìn)化。真格基金管理合伙人戴雨森當(dāng)時(shí)便表示,“從ChatGPT中,我看到新一代的AI技術(shù)隨著不同組件走向成熟,已經(jīng)進(jìn)入樂高化模塊化的趨勢(shì)。這意味著迭代速度會(huì)越來越快,原來需要單獨(dú)開發(fā)的部分變成了公用的、可復(fù)用、可調(diào)用的組件。”
規(guī)模與效率
在產(chǎn)業(yè)界,AI工程化則帶來了更直接的經(jīng)濟(jì)效益。
近日,阿里巴巴集團(tuán)副總裁、AI科學(xué)家賈揚(yáng)清提出,工程化和開源是AI普惠最重要的兩大支撐。而實(shí)現(xiàn)AI工程化的關(guān)鍵,是要提升三個(gè)效率:通過云原生的計(jì)算,提升計(jì)算效率;通過標(biāo)準(zhǔn)研發(fā)范式,提升研發(fā)效率;通過大數(shù)據(jù)AI一體,提升數(shù)據(jù)應(yīng)用效率”。
賈揚(yáng)清以阿里達(dá)摩院上云為例稱,通過一個(gè)云原生的AI平臺(tái)PAI,就支撐算法團(tuán)隊(duì)從規(guī)模、效率和易用性上面不斷突破。在規(guī)模上,可以支撐10萬億參數(shù)的預(yù)訓(xùn)練大模型,在效率上,通過AI開放服務(wù)平臺(tái)OpenMind則可以服務(wù)日均1萬億次左右的調(diào)用。
借助AI工程化體系,阿里云服務(wù)了非常多云上的客戶,而騰訊云,也憑借AI工程化解決了規(guī)模化的難題。
2021年初,騰訊云幫助上海富馳高科技股份有限公司(簡(jiǎn)稱“富馳高科”)解決了一個(gè)大問題。作為一家金屬粉末注射成型(MIM)產(chǎn)品專業(yè)制造商,如何提高質(zhì)檢效率,一直困擾著富馳高科。
過去,富馳高科的質(zhì)檢工作主要是由人工完成,這并非它不愿意使用自動(dòng)化手段,而是市面上幾乎沒有能夠滿足其質(zhì)檢需求的方案。后來,騰訊云研發(fā)團(tuán)隊(duì)經(jīng)過半年的艱苦攻堅(jiān),成功敲開了工業(yè)質(zhì)檢的大門。
但是,讓騰訊云副總裁、騰訊云智能研發(fā)負(fù)責(zé)人、優(yōu)圖實(shí)驗(yàn)室研發(fā)負(fù)責(zé)人吳永堅(jiān)頭疼的是,做完富馳高科項(xiàng)目后,該如何把AI質(zhì)檢能力復(fù)制到更多項(xiàng)目中。吳永堅(jiān)告訴21世紀(jì)經(jīng)濟(jì)報(bào)道,“如果每個(gè)項(xiàng)目都要像在富馳高科這樣投入,那成本方面,騰訊云承擔(dān)不起”。
在又做了幾個(gè)項(xiàng)目之后,騰訊云終于找到了可行辦法。“我們拆解算法里的每一個(gè)流程,精細(xì)到每一步明確要做什么,然后將其沉淀到騰訊云AI開發(fā)服務(wù)平臺(tái)——TI平臺(tái)上,最終形成了一個(gè)面向工業(yè)質(zhì)檢場(chǎng)景的產(chǎn)品化平臺(tái)”,吳永堅(jiān)說。
今年,生產(chǎn)3C產(chǎn)品金屬結(jié)構(gòu)件的立鎧精密也成為騰訊云的工業(yè)質(zhì)檢客戶。相比富馳高科,立鎧精密的產(chǎn)品種類更多,涉及的工藝也更復(fù)雜,但在服務(wù)立鎧精密時(shí),吳永堅(jiān)覺得容易了很多。
“當(dāng)初我們還需要派大量算法工程師去富馳高科駐場(chǎng)辦公,但現(xiàn)在,只需在項(xiàng)目前期派少量算法人員過去,其余大部分工作都可以在TI平臺(tái)上完成,效率提高非常多”,吳永堅(jiān)說。
這種轉(zhuǎn)變,就是AI工程化價(jià)值的體現(xiàn)?,F(xiàn)在,面對(duì)不同的質(zhì)檢場(chǎng)景,騰訊云都可以通過工業(yè)質(zhì)檢訓(xùn)練平臺(tái)來提供解決方案,這背后,依靠的已不僅僅是算法團(tuán)隊(duì),而是需要工程、產(chǎn)品、數(shù)據(jù)運(yùn)營(yíng)等團(tuán)隊(duì)共同支撐,進(jìn)行的是一種體系化建設(shè)。
奔向通用AI
中國(guó)信通院今年發(fā)布的《人工智能白皮書(2022)》(以下簡(jiǎn)稱“白皮書”)指出,未來,人工智能除了重視技術(shù)創(chuàng)新以外,還會(huì)更加關(guān)注工程實(shí)踐和可信安全,這也構(gòu)成了新的“三維”發(fā)展坐標(biāo),牽引人工智能技術(shù)產(chǎn)業(yè)邁向新的階段。
其中,工程實(shí)踐能力正成為釋放人工智能技術(shù)紅利的重要支撐。白皮書提到,AI行業(yè)在工程實(shí)踐方面的努力,最早可追溯至Caffe、TensorFlow、PaddlePaddle等開源框架的誕生,通過屏蔽底層硬件和操作系統(tǒng)細(xì)節(jié),大幅降低模型開發(fā)和部署難度,有效推動(dòng)了人工智能技術(shù)的擴(kuò)散。
而當(dāng)前,人工智能與云計(jì)算、大數(shù)據(jù)等技術(shù)的融合不斷深入,圍繞著數(shù)據(jù)處理、模型訓(xùn)練、部署運(yùn)營(yíng)和安全監(jiān)測(cè)等各環(huán)節(jié)的工具鏈不斷豐富,也使得人工智能研發(fā)管理體系日益完善。
白皮書認(rèn)為,隨著工程實(shí)踐能力的不斷提升,“小作坊、項(xiàng)目制”的AI賦能方式正在成為歷史,未來將會(huì)更加便捷、高效地實(shí)現(xiàn)人工資高就能落地應(yīng)用和產(chǎn)品交付。
具體而言,AI工程化主要聚焦于工具體系、開發(fā)流程、模型管理全生命流程的高效耦合。在工具體系層面,體系化與開放化成為研發(fā)平臺(tái)技術(shù)工具鏈的發(fā)展特點(diǎn);開發(fā)流程方面,工程化關(guān)注AI模型開發(fā)的生命流程,追求高效且標(biāo)準(zhǔn)化的持續(xù)生產(chǎn)、持續(xù)交付和持續(xù)部署。
而模型管理方面,隨著企業(yè)智能化應(yīng)用的逐步加深,模型種類和數(shù)量大幅增長(zhǎng),企業(yè)需要建設(shè)對(duì)模型生命周期的管理機(jī)制,并對(duì)模型的版本歷程、性能表現(xiàn)、相關(guān)數(shù)據(jù)、衍生的模型檔案等進(jìn)行標(biāo)準(zhǔn)化的管理運(yùn)維。
所以接下來,AI企業(yè)能否快速賦能各行各業(yè),響應(yīng)多樣化需求,關(guān)鍵因素就在于企業(yè)的工程化能力。
另一方面,通用人工智能(AGI,Artificial General Intelligence)作為AI領(lǐng)域的終極目標(biāo),實(shí)現(xiàn)的過程也需要依靠AI工程化能力。雖然目前距離實(shí)現(xiàn)真正的通用人工智能還有很長(zhǎng)一段距離,但是,在一些特定場(chǎng)景下的通用AI,已經(jīng)出現(xiàn)。
比如ChatGPT,便是一種自然語(yǔ)言處理的通用AI模型,因?yàn)樗梢曰卮鸶采w各種領(lǐng)域的問題,而不是專門針對(duì)某一個(gè)領(lǐng)域設(shè)計(jì)的模型。
目前,在很多領(lǐng)域人工智能已經(jīng)趕上甚至超過人類水平,比如語(yǔ)言理解、語(yǔ)音識(shí)別、視覺識(shí)別等。當(dāng)人們能夠借助AI工程化能力,把這些AI技術(shù)規(guī)?;瘧?yīng)用到諸如工業(yè)質(zhì)檢、機(jī)器人等產(chǎn)業(yè)當(dāng)中時(shí),將大幅提升人類的工作效率和質(zhì)量,而這,也是人工智能產(chǎn)業(yè)致力于實(shí)現(xiàn)的目標(biāo)。
聲明:凡資訊來源注明為其他媒體來源的信息,均為轉(zhuǎn)載自其他媒體,并不代表本網(wǎng)站贊同其觀點(diǎn),也不代表本網(wǎng)站對(duì)其真實(shí)性負(fù)責(zé)。您若對(duì)該文章內(nèi)容有任何疑問或質(zhì)疑,請(qǐng)立即與中國(guó)機(jī)器人網(wǎng)(www.baoxianwx.cn)聯(lián)系,本網(wǎng)站將迅速給您回應(yīng)并做處理。
電話:021-39553798-8007
電話:021-39553798-8007
更多>相關(guān)資訊
0 條相關(guān)評(píng)論