隨著自然語言處理(NLP)和機器人流程自動化(RPA)的發(fā)展日漸成熟,智能化辦公機器人開始走進越來越多的企業(yè),“搶”起了辦公室白領(lǐng)的飯碗。
智能化辦公機器人也會是2020世界人工智能大會上的亮點之一。
“辦公機器人的本質(zhì)是替代公司白領(lǐng)對文字資料進行識別、理解與處理。”達觀數(shù)據(jù)CEO陳運文在接受第一財經(jīng)記者采訪時表示,與人們?nèi)粘A奶煊玫降目谡Z文字不同,辦公機器人需要處理的大多是篇幅較長的素材,包含目錄、章節(jié)、段落等要素,更加強調(diào)邏輯性、勾稽關(guān)系。與英文相比,中文的文字處理更復(fù)雜一些,因為中文的詞性比較微妙,在不同語境下表達的意思可能也千差萬別,這就需要機器去不斷地學(xué)習(xí)。
記者了解到RPA的核心能力分為兩部分:一部分是可以模擬人的鍵盤和鼠標(biāo)的操作;另一部分可以理解文字內(nèi)容,進行相關(guān)的理解、分析和認(rèn)知。對于前者所涉及的技術(shù)十幾年前就存在,稱之為“外掛”,外掛可以像人一樣模擬賬號登錄上去,模擬去點擊。不過,當(dāng)年只是一個早期狀態(tài),只能做模擬人去玩游戲,今天用在真正日常的辦公工作當(dāng)中,模擬白領(lǐng)去完成白領(lǐng)的日常工作。對于后者,需要運用自然語言處理能力去對文字資料進行閱讀、理解和分析。
與搜狗、騰訊、科大訊飛等競爭者直接面向C端市場不同,成立于2015年的達觀數(shù)據(jù),主要是面向B端,利用NLP、光學(xué)字符識別(OCR)、知識圖譜等技術(shù),為企業(yè)和政府機構(gòu)提供RPA、文檔智能審閱、智能推薦等智能產(chǎn)品,讓計算機協(xié)助人來完成業(yè)務(wù)流程自動化,提高企業(yè)效率。
達觀RPA機器人已經(jīng)迭代到9.0版本,對各行各業(yè)文檔理解能力不斷刷新, 目前達觀辦公機器人可以閱讀和處理合同、簡歷、財務(wù)報表、報關(guān)單、各類報告、公司公告、政府公文等40多種文檔類型。
以檢驗一份企業(yè)招股書為例,在經(jīng)過算法讀取后,達觀辦公機器人會在運行界面右側(cè)邊欄標(biāo)示出部分疑似錯誤數(shù)據(jù)。這些疑似錯誤可能是計算錯誤,也可能是數(shù)據(jù)內(nèi)部的邏輯錯了,計算機可以提示給財務(wù)人員,減少財務(wù)的工作量。同樣的工作如果交給人類來做,需要花幾小時,機器只要幾分鐘,常見文本的準(zhǔn)確率約為98%。
然而,將基礎(chǔ)工作交給機器來完成,這其中會涉及安全問題。
記者了解到,達觀數(shù)據(jù)在安全方面做了賬號權(quán)限管理、數(shù)據(jù)隔離、加密等工作。對于數(shù)據(jù)隔離,整個RPA過程中,每個環(huán)節(jié)都做了存檔、截圖、備份,這樣就可以隨時回溯機器人在哪個部分做了哪些工作,每個工作都有痕跡,這樣可以更好地來監(jiān)控機器人的每個動作,確保這個機器人工作能夠在人類掌控過程當(dāng)中。
不只是達觀,來也科技也看上這一市場。
去年6月,人工智能企業(yè)來也科技與RPA公司奧森科技合并,合并后的公司宣布完成3500萬美元B+輪融資,進軍“RPA+AI”市場。融資額將主要用于招募RPA產(chǎn)品研發(fā)和銷售人才,并在持續(xù)加強NLP、深度學(xué)習(xí)和強化學(xué)習(xí)等技術(shù)的拓展,加速智能辦公機器人解決方案在各個行業(yè)的商業(yè)化落地。
此前,國務(wù)院印發(fā)《新一代人工智能發(fā)展規(guī)劃》,提出“到2030年,中國將實現(xiàn)人工智能核心產(chǎn)業(yè)規(guī)模超過1萬億元,帶動相關(guān)產(chǎn)業(yè)規(guī)模超過10萬億元”。以數(shù)據(jù)為生產(chǎn)要素的新一輪產(chǎn)業(yè)變革正在襲來,人工智能將成為帶動中國產(chǎn)業(yè)升級和經(jīng)濟轉(zhuǎn)型的主要動力。