伴隨AI技術(shù)在翻譯行業(yè)逐步深入的應用,如何在確保機器翻譯優(yōu)勢的前提下,滿足商用交付質(zhì)量成當下亟待解決的問題。
傳神語聯(lián)在十年前提出多語智能信息處理,并通過旗下的語聯(lián)網(wǎng)平臺,將多方面的自然語言處理技術(shù)、大數(shù)據(jù)技術(shù)、大量在線譯員、以及大規(guī)模的術(shù)語語料資產(chǎn)有機結(jié)合,通過創(chuàng)新的人機協(xié)作體系向各語言服務機構(gòu)賦能,幫助各類組織和個人,以前所未有的綜合效率和成本獲得所需的語言服務,從而實現(xiàn)更快、更豐富的全球文化、貿(mào)易和信息交流。
那么,自然語言處理技術(shù)對語言服務行業(yè)將帶來怎樣的改變?與AI時代有著怎樣密不可分的關(guān)系?
探索多語智能,求解千年難題
事實上,翻譯作為溝通世界的紐帶與基礎要素,早在東漢就有記載。而在形成規(guī)模和組織后的1600年,行業(yè)都未曾出現(xiàn)重大突破;法國科學家早在1933年開始暢想機器翻譯,在近代50年才有突破性發(fā)展。
隨著全球化深入和數(shù)字化時代到來,翻譯不再只是滿足高端人士的工作需求,而是深入人們生活的各個場景與基礎生活需求,如購物、知識獲取、社交等多語需求場景,無時不在,無處不有;未來,新的應用場景像電網(wǎng)上電器一樣,不斷增長。
物流行業(yè)的智能分揀機器人、各種工業(yè)機器人等,都是人工智能相對成熟的“場景邊界”效果。但在“開放世界”中的多語種網(wǎng)頁瀏覽與知識獲取、生活交互場景等,還有很長的路要走。自然語言的處理則是解決這些問題的關(guān)鍵。
以上場景的應用,就需要強大的自然語言處理。而當前,一般的機器翻譯引擎都只能在簡單的新聞稿等領(lǐng)域有比較好的表現(xiàn),在復雜的專業(yè)領(lǐng)域則無法勝任。普適性的機器翻譯在廣泛使用上,也已遇到瓶頸。
在此大背景下,創(chuàng)建語聯(lián)網(wǎng)的大膽想法涌入何恩培的腦海,并在心底生根發(fā)芽。
從2011年設想至2017年醞釀問世,傳神語聯(lián)用了6年時間。從調(diào)研、論證到技術(shù)探索與創(chuàng)新,一次次的自我革命,終于等來傳神語聯(lián)“人+機器,孿生譯員”誕生的這一刻。
“孿生譯員”模式,通過設置“場景邊界”的方式,跟蹤一個翻譯組織乃至一名譯員的翻譯過程,在翻譯結(jié)果、上下文等場景化數(shù)據(jù)中進行學習,建立多維度異構(gòu)模型并持續(xù)迭代,讓每個翻譯組織或譯員,都可以將自己的翻譯經(jīng)驗、風格數(shù)字化克隆,形成具有專屬特征的孿生翻譯引擎。同時,將自己的翻譯資產(chǎn),變成24小時躺著賺錢的服務能力。
例如文本解析、智能聚類、智能分拆、智能匹配、智能糾錯、智能合并等一系列技術(shù),都將在這一過程中發(fā)揮作用,組織起幾十、幾百乃至幾千名翻譯人員同時處理一個翻譯任務,并使得每個人都能夠很好地完成自己的工作,從而遠超人工翻譯效率,并保證翻譯結(jié)果。
技術(shù)賦能創(chuàng)新,信息獲取和轉(zhuǎn)化方式更便捷
數(shù)字技術(shù)的不斷發(fā)展,為互聯(lián)網(wǎng)經(jīng)濟發(fā)展賦予了全新思路,技術(shù)的融入,賦予了人們快速跨越語言障礙的方式方法,更便捷更高效的滿足信息轉(zhuǎn)化的需求。
傳神語聯(lián)網(wǎng)研究院執(zhí)行院長何征宇曾在演講中提到,語聯(lián)網(wǎng)自主開發(fā)構(gòu)建IOLAIDrive語聯(lián)網(wǎng)人工智能底層支撐系統(tǒng),并在產(chǎn)能智能化組織調(diào)度、機器翻譯以及人機共譯等三大關(guān)鍵核心NLP技術(shù)領(lǐng)域取得突破進展。語聯(lián)網(wǎng)提出新的交付標準“HWD”,即交付速度的計量記錄刷新: 十萬字以小時(HOUR)計,百萬字以天(DAY)計,千萬字以周(WEEK)計,將來還可能進一步提升。
傳神語聯(lián)創(chuàng)始人兼董事長何恩培表示,“信息大爆炸時代讀取信息的對象,已經(jīng)從單純的人類,變?yōu)榱巳伺c機器同時閱讀和處理。因此多語信息的處理,不僅要做好效能提升,更要在此基礎上進行創(chuàng)新突破,打破人力處理能力的瓶頸和界限,銜接好人與機器,這是身處多語信息處理領(lǐng)域所有企業(yè)的共同使命。”