2018世界人工智能大會剛落幕,科大訊飛卻陷入了“AI同傳造假”的風(fēng)波。
9月20日,一位同傳譯員在知乎上發(fā)文稱,在上海的一場會議中,訊飛的翻譯其實為人工同傳,并非機(jī)器智能翻譯,并且譯文由機(jī)器進(jìn)行朗讀。
這容易讓觀眾產(chǎn)生“都是人工智能翻譯”的錯覺,而忽略背后同傳譯員們的勞動成果。對此,9月21日,科大訊飛的回復(fù)是,“科大訊飛從來沒有把同傳翻譯包裝成機(jī)器翻譯。”
9月21日,科大訊飛董秘、高級副總裁江濤接受21世紀(jì)經(jīng)濟(jì)報道記者采訪時說道:“盡管機(jī)器翻譯獲得發(fā)展,明年能達(dá)到英語專業(yè)8級的水平,但依然沒辦法代替同傳??拼笥嶏w沒有提到AI同傳,并沒有造假吹牛,目前的情況是一個誤會。”
他進(jìn)一步解釋道,科大訊飛的智能會議系統(tǒng)有兩種工作模式,一種是全自動翻譯,系統(tǒng)識別中文并轉(zhuǎn)化成英語、日語、韓語等同步顯示在屏幕上;另外一種就是在專業(yè)的會議上,直接獲取現(xiàn)場同傳的聲音,再同步到大屏幕上。“科大訊飛沒有做混淆,而同傳的對接是由會議主辦方聯(lián)系的。”
科大訊飛方面還提到,當(dāng)機(jī)器同時提供轉(zhuǎn)寫和翻譯服務(wù)時,文字展示區(qū)Logo顯示為“訊飛聽見—離線翻譯系統(tǒng)”;機(jī)器僅提供轉(zhuǎn)寫服務(wù)時,文字展示區(qū)Logo顯示為“訊飛聽見”。訊飛聽見是科大訊飛旗下提供語音轉(zhuǎn)寫、翻譯的平臺。
盡管目前語音識別成為AI的先行領(lǐng)域,但是語音翻譯依舊是一大難題,現(xiàn)階段無法精準(zhǔn)翻譯屬正常現(xiàn)象。據(jù)21世紀(jì)經(jīng)濟(jì)報道記者了解,識別同傳的譯文在業(yè)內(nèi)屬于普遍的做法,不少公司以此進(jìn)行夸大宣傳。
人工還是智能?
談及人工智能時代,機(jī)器能否代替人工是關(guān)注焦點。在語音領(lǐng)域,科大訊飛表示,希望通過語音轉(zhuǎn)寫和翻譯技術(shù)幫助同傳提高工作效率、減少失誤,形成人機(jī)耦合的同傳新模式,并不是去替代同聲傳譯。而科大訊飛董事長劉慶峰在不同場合均表示,人機(jī)協(xié)同、人工智能+行業(yè),才是未來人工智能最有希望做成的。
在走向人機(jī)耦合的操作過程中,智能固然離不開人工,但是,雙方在配合工作中發(fā)生了“摩擦”。
對于此次同傳譯者的“投訴”,Ledge同聲翻譯創(chuàng)始人王民杰告訴21世紀(jì)經(jīng)濟(jì)報道記者:“除了用機(jī)器人的聲音把譯文讀出來不太普遍之外,其他(機(jī)器識別同傳譯文)都很普遍。對于外國人的英文演講,基本上采取的模式就是由我們?nèi)斯ね瑐鞣g成中文,然后他們再把我們的中文從聲音轉(zhuǎn)換成文字顯示在大屏幕上。”
“因此,同傳界的很多人都覺得是科大訊飛剽竊了我們的勞動成果,讓觀眾誤以為是機(jī)器在同傳,而不是人工同傳。”王民杰繼續(xù)說道,“但是我們在處理問題上也是兩難,我們希望科技能夠發(fā)展,幫助我們進(jìn)行翻譯。但是現(xiàn)在人工智能被過度夸大,我們身份特殊,也擔(dān)心外界說自己由于害怕失業(yè)而進(jìn)行攻擊。”
王民杰的翻譯公司和科大訊飛合作密切,此次事件發(fā)酵后,他也向科大訊飛提出意見,希望對方在大屏幕上顯示他們只是語音識別,聲音來自同傳。
另一位資深同傳譯者告訴21世紀(jì)經(jīng)濟(jì)報道記者:“個人覺得機(jī)器代替人工同傳還要很長時間,人機(jī)結(jié)合更實際。”
訊飛翻譯產(chǎn)品經(jīng)理劉晨璇則向21世紀(jì)經(jīng)濟(jì)報道記者復(fù)盤道:“事情發(fā)生在9月19-20日舉行的2018創(chuàng)新與新興產(chǎn)業(yè)發(fā)展國際會議上,我們向主辦方提供了兩種方案,一種是自動翻譯,另一種是對同傳語音進(jìn)行識別,屏幕是轉(zhuǎn)寫的同傳語音,我們并沒有對此進(jìn)行包裝。”
也有人工智能業(yè)內(nèi)人士告訴21世紀(jì)經(jīng)濟(jì)報道記者,其實大家都用這種方式進(jìn)行,有“偷換概念”的嫌疑。但是同傳譯者的知識產(chǎn)權(quán)有待商榷,一般其產(chǎn)權(quán)屬于雇用了同傳的公司。
在近年來大眾對于人工智能、人工翻譯的期望頗高。而反觀公司,也有將產(chǎn)品“趕鴨子上架”的情況出現(xiàn)。當(dāng)然,語音方面有不少成熟的解決方案,然而觀眾的預(yù)期和企業(yè)產(chǎn)品效果之間差異過大,也導(dǎo)致此次風(fēng)波發(fā)酵。
在2017年,科大訊飛就曾表態(tài):現(xiàn)階段人工智能技術(shù)發(fā)展不需要“被神化”。 “目前,機(jī)器翻譯已經(jīng)取得非常大的進(jìn)步,在衣食住行等常用生活用語上的中英翻譯可以達(dá)到大學(xué)六級的水平,能夠幫助人們在一些場景處理語言交流的問題,但距離會議同傳以及高水平翻譯所講究的‘信、達(dá)、雅’還存在很大的差距。”
對于人工耦合,江濤告訴21世紀(jì)經(jīng)濟(jì)報道記者,科大訊飛的人工智能系統(tǒng)會結(jié)合聽和看的信息,也會針對關(guān)鍵詞進(jìn)行解釋,相當(dāng)于有一個助手在幫助譯者進(jìn)行翻譯,降低了同傳口譯者的工作強(qiáng)度。而科大訊飛已經(jīng)和上海外國語大學(xué)成立了研究院,探討人機(jī)協(xié)同模式。在本周的2018世界人工智能大會上,就有三個嘉賓發(fā)言采取了人工耦合的模式。
應(yīng)該說,科大訊飛在語音領(lǐng)域技術(shù)領(lǐng)先,但是仍面臨著不少瓶頸。
首先從科大訊飛的產(chǎn)品技術(shù)方向來看,主要包括語音交互、機(jī)器翻譯、文本識別。其中,語音交互是科大訊飛的老本行,包括語音識別、語音合成等。另外,采用日趨成熟的自然語言理解,也為語音交互提供了更強(qiáng)的支撐。
尤其是語音合成方面,科大訊飛在業(yè)界比賽中屢次奪冠。其通過機(jī)器學(xué)習(xí)提取聲音的特征,通過聲學(xué)波形合成出仿真聲音。該技術(shù)的難點之一,就是如何能夠騙過耳朵達(dá)到真人說話的效果。
但是在技術(shù)成熟的同時,仍有難題需要攻克。比如,遇到同音字識別、環(huán)境比較嘈雜的情況以及中文和英文夾雜的時候,語音的識別率就會下降。
劉慶峰在2018世界人工智能上表示,科大訊飛是全球唯一在語音合成中機(jī)器超過人工的公司,在安靜的環(huán)境下,演講主題確定的情況下語音準(zhǔn)確率高,但是多人說話噪音環(huán)境下的識別率是關(guān)鍵。在他看來,通過大規(guī)模后臺服務(wù)集群,語音識別正在走向?qū)嵱?。同時,用戶也對方言、多人說話、安全保護(hù)等方面提出了新要求。
一位人工智能從業(yè)者告訴21世紀(jì)經(jīng)濟(jì)報道記者,自然語言處理技術(shù)需要得到攻克,這就涉及到機(jī)器的知識、情感、邏輯等能力。而這三個人類在幼兒時期就能掌握的機(jī)能,對于機(jī)器來說是難上加難。語音本身不是最難,但是語言背后需要人類的知識系統(tǒng)以及專業(yè)領(lǐng)域的能力,這些數(shù)據(jù)的掌握并非易事。而人工智能公司目前對翻譯的野心很大,短時期內(nèi)系統(tǒng)性地解決還是較為困難。