記者 孫兆
人工智能現(xiàn)已成為提高我國創(chuàng)新能力、信息化與工業(yè)化深度融合、推動重點領域突破發(fā)展、全面推進制造業(yè)結構調整、提高制造業(yè)國際化發(fā)展水平的關鍵性核心技術。據前瞻產業(yè)研究院發(fā)布的《中國人工智能行業(yè)市場前瞻與投資戰(zhàn)略規(guī)劃分析報告》統(tǒng)計數據顯示,2015年中國人工智能市場規(guī)模已突破100億元,預測在2019、2020年中國人工智能市場規(guī)模將達500億元、710億元。
隨著2010年語音識別和計算機視覺領域產生重大突破,到2015年,國內迎來人工智能創(chuàng)業(yè)熱潮,獨角獸不斷涌現(xiàn),融資紀錄被不斷打破。2012年—2019年8月人工智能領域共發(fā)生2787件投融資事件,總融資額達4740億元。
下游的爆發(fā)式增長為人工智能基礎數據服務的發(fā)展提供了長期向好的基本面。根據艾瑞咨詢發(fā)布的《2019年中國人工智能基礎數據服務研究報告》顯示,在經歷了一段時期的野蠻生長之后,人工智能基礎數據服務行業(yè)進入成長期,行業(yè)格局逐漸清晰。
國內人工智能熱潮爆發(fā),大量的AI公司拿到融資,為了不斷提高算法精度,數據采標需求也空前爆發(fā),一度催生了行業(yè)的繁榮。隨著競爭加快,AI公司對訓練數據的質量要求也不斷提高,并且當產業(yè)落地成為主旋律,需求方對垂直場景的定制化數據采標需求成為主流,眾多小型AI基礎數據服務公司從數據質量和采標能力上達不到要求,或被淘汰,或依附大平臺,行業(yè)格局逐漸清晰,頭部公司實力逐漸凸顯。
而隨著算法需求越來越旺盛,目前機器輔助標注、人工主要標注的手段需要改進提升,增強數據處理平臺持續(xù)學習和自學習能力,增加機器能夠標注維度、提升機器處理數據的精度,由機器承擔主要標注工作將成為下一階段的行業(yè)重心。未來,越來越多的小概率事件所產生的數據需求增強,人機協(xié)作標注的模式性價比不足,機器模擬或機器生成數據會是解決這一問題的良好途徑,及早研發(fā)相應技術也將成為AI基礎數據服務商未來的護城河。
從融資規(guī)模來看,人工智能基礎數據服務市場的融資多集中在千萬級別。2015年人工智能基礎數據服務商獲得的融資金額相對較高,標志著行業(yè)初露頭角,受到資本的認可。從獲得融資的企業(yè)數量來看,目前獲得融資的玩家并不多,資本市場表現(xiàn)的活躍度不高。
艾瑞表示,2018年中國人工智能基礎數據服務市場規(guī)模為25.86億元,其中數據資源定制服務占比86.2%,數據集產品占比為12.9%,其他數據資源應用服務占比為0.9%;行業(yè)年復合增長率為23.5%,預計2025年市場規(guī)模將突破110億元。從整體增速來看,行業(yè)發(fā)展較為穩(wěn)健,下游人工智能行業(yè)持續(xù)發(fā)力將形成長期利好。
而對于人工智能基礎數據服務發(fā)展,艾瑞指出,單純依據客戶各個項目的訴求進行數據采集和標注屬于被動執(zhí)行,主觀能動性低、行業(yè)邊界有限,制約著AI基礎數據服務的發(fā)展。未來,數據公司應該能夠更懂算法技術、更懂需求場景,甚至能參與到算法的研發(fā)中來,給出數據采標方面的優(yōu)化建議,這也為數據服務商形成差異化競爭帶來了契機,尤其是在AI落地階段,將在收入和業(yè)務邊界上實現(xiàn)突破。