熱搜： 工業(yè) 發(fā)那科機器人上海自動化 ABB機器人機器人工業(yè)機器人機器工業(yè)機器人展展會

反思仿制Echo的熱潮：為什么國外巨頭要布局AI交互？

日期：2017-03-10 評論：0

標簽：

美國調查公司VoiceLabs在本年初發(fā)布了《2017年語音報告》，報告中對目前美國智能語音市場進行了調查，特別是亞馬遜Alexa和谷歌Google Home的開發(fā)者和消費者。報告中預測2017年將有2450萬臺以語音為主要交互方式的智能硬件產品發(fā)貨，市場總量將達到3300萬臺，市場規(guī)模超過200億美元。

↑ 語音為主的智能硬件產品

隨著亞馬遜的智能音箱Echo銷量逼近千萬，蘋果的智能耳機AirPods登頂美國無線耳機市場榜首，亞馬遜Alexa在美國CES展上大放異彩，國內各個科技公司也紛紛開始了進入語音交互領域。

無論是IT科技巨頭阿里、百度、騰訊、科大訊飛等，還是陸續(xù)出現的思必馳、聲智科技、云知聲、三角獸、驀然、Rokid等創(chuàng)業(yè)公司，智能語音產品和語音助手成為競相追隨的熱門話題，儼然形成了一股全行業(yè)研究亞馬遜Echo的熱潮。根據聲智科技提供的數據，國內已經有超過200多家公司正在研發(fā)類似Echo的智能音箱。

然而，就在國內科技公司還在模仿Echo之時，國外的科技巨頭已經開始進一步搶奪全球語音交互市場的控制權。無論是行業(yè)標準的定制，還是戰(zhàn)略專利的布局，抑或是音頻數據集的開放，以及各種產業(yè)生態(tài)聯盟的搭建，一切都在悄然的進行中。

智能語音交互的行業(yè)標準之爭拉開帷幕

3月6日，微軟在其官網上發(fā)布了新版本的語音平臺測試標準，即2.1版本。微妙的是，就在微軟發(fā)布消息的同時，我們驚喜的發(fā)現，亞馬遜的官方網站上也已經推出了其語音測試的最新標準，智能語音交互的行業(yè)標準之爭已經開始“漸入佳境”。

微軟指出，目前語音平臺支持Windows 10中的所有語音體驗，如Cortana和Dictation，而其最新的測試標準適用于所有使用微軟語音平臺的音頻輸入設備。其中，直接影響的設計參數，包括語音識別精度和語音處理算法的性能。目前，微軟還沒有把該測試標準作為設備認證必不可少的環(huán)節(jié)。然而，隨著測試標準日益規(guī)范化，平臺用戶數增多，未來的結果一切都不言而喻。

↑ 測試環(huán)境搭建圖

區(qū)別于微軟，亞馬遜也為其所有采用Alexa開發(fā)的智能語音產品設立了相應測試標準，然而，此測試并未公開，還是采用黑盒測試的方式，用戶需提交產品給亞馬遜進行相應測試。其產品通過認證測試后，搭載Alexa的智能語音交互產品才可獲得Alexa認證，并在Alexa Smart Home商店出售。

↑ 目前通過測試獲得認證的企業(yè)

語音交互市場專利布局競爭更為激烈

一直以來，一旦掌握行業(yè)標準制定的主導權也就掌握了整個市場的控制權。與其有同樣魅力的便是專利。當今的激烈市場競爭中，專利早已經成為市場競爭的一柄利劍。

從1月19日國家知識產權局公布的數據顯示：過去的2016年，我國國家知識產權局共受理發(fā)明專利申請133.9萬件，同比增長21.5%，這已經是我國第6個年頭專利受理量居世界首位。同時，國外專利的申請情況也保持良好的增長勢頭，2016年通過《專利合作條約》（PCT）途徑提交的國際申請4.50萬件。然而，雖然專利整體保持良好的發(fā)展態(tài)勢，但是，在語音交互領域國內的專利布局與國外尚存差距。

眾所周知，語音交互涉領域廣泛，是一門多項技術融合的交叉學科，涉及到信號處理、模式識別、概率論與信息論、發(fā)聲機理和聽覺機理、神經網絡，語音識別，機器學習等。其中，語音以及音頻的編解碼（G10L），電數字數據處理（G06F），電話通信（H04M），這三個領域專利累積數量最多，比例高達80%。

從德溫特世界專利索引數據庫平臺收錄的自1963年以來全世界40多個專利機構的基本發(fā)明的數據來看，語音識別的相關專利約2萬件。

↑ 根據CNKI自1985年后收錄的中國專利的數據來檢索關鍵詞語音識別情況

其中，截止到2015年，僅“語音識別”累積專利申請量方面來看，前五位的為IBM，NEC，微軟，Nuance和東芝，分別為749件，508件，506件，415件，406件。而從2010年至2015年的語音識別專利的申請量來看，除了IBM被Google替代，降至第7名，其他幾位仍然保有專利數量的優(yōu)勢，排名順序是Nuance，谷歌，微軟，東芝，NEC，分別為206件，178件，141件，102件。

巨頭形成的專利防御攻勢仍然迅猛，而業(yè)界所關心的后起之秀也來勢洶洶，2010至2015年，僅“語音識別”方面，谷歌布局專利178件、蘋果布局專利25件、亞馬遜布局專利33件。

對于國外的科技公司來說專利之間的斗法更加劍拔弩張，專利壁壘正在逐漸形成。從《中國知識產權報》發(fā)布的數據來看，截止至2017年1月，蘋果公司在語音領域的專利申請量為695件，而谷歌公司為1261件。從語音領域專利布局方面看，兩家公司在語音領域的技術除了自主研發(fā)外，還通過并購語音類相關企業(yè)或者收購語音技術相關專利來加強專利儲備。

2013年蘋果公司收購語音識別公司NovaurisTechnologies。經過收購，蘋果公司獲取了該公司的4件語音專利。通過這4件專利，蘋果Siri由可通過簡單識別單個詞句來理解上下文，發(fā)展到通過識別超過2.45億個短語來輔助理解上下文的功能，從而大幅度提升語音系統(tǒng)的理解力。

為了應對蘋果公司帶來的激烈競爭，谷歌公司采用了專利“圍剿”戰(zhàn)術。2013年，谷歌公司收購了Wavii公司的一件專利，該專利技術使得谷歌公司的語音搜索識別正確率提高了25%。同年，又收購了SR Tech Group公司的兩件關于語音識別的專利，并購入雅虎公司的一件名為“背景會話上下文搜索技術”的專利，通過購買專利，谷歌公司擁有了完整的語音識別引擎。

目前，中國的語音識別企業(yè)專利布局還主要是在國內，國際領域的專利布局情況和國外企業(yè)對比，確實還存在巨大差距。不過，國內企業(yè)的知識產權意識也越來越強烈，百度，科大訊飛，聲智科技等在近幾年的專利申請上也有不錯的作為。

對比于市場銷量帶來的直接經濟效益，知識產權的價值還不能充分體現。然而，在提高公司效益，搶占市場，保持公司可持續(xù)發(fā)展時，知識產權的價值不可小覷，專利作為企業(yè)不得不向公眾透露以獲取獨占權的關鍵信息，對其進行詳細、周密、綜合的分析，可以從中獲得巨大的商業(yè)價值，特別是在國際市場競爭中。

谷歌開放音頻數據集，用意不言而喻

3月8日，谷歌開放了一個大規(guī)模的音頻數據集 AudioSet。該數據集包含了 632 類的音頻類別，收集了2084320 條人工標記的每段 10 秒的YouTube視頻中的聲音剪輯片段（包括 527 個標簽）。

這些特定音頻是使用基于元數據，上下文（例如，鏈接）和內容分析的搜索來標記的。聲音內容十分廣泛，包括人類的聲音和動物的聲音，各種類別樂曲的聲音和每天日常環(huán)境中的各種聲音等。谷歌聲稱：此次開放這個數據庫的目的就是為了滿足學術研究的需求。

從此前ImageNet廣泛數據集的開放效果來看，大部分識別圖像中的目標研究已經從中獲益。而此次，對于利用AudioSet公開數據集訓練機器學習模型的語音識別研究者或者技術公司來說，無疑是獲益匪淺。然而目前，國內的科技巨頭還沒有開源音頻數據集的動作，哪家公司可以有魄力的貢獻資源，我們還要翹首以待？

組建產業(yè)聯盟，試圖瓜分市場蛋糕

毫無疑問，通過語言交流獲取知識是人類最有效的學習方式。從PC時代的鍵盤鼠標過渡到移動互聯網的觸屏操控，下一個AI時代，無疑將會是以語音、體感等多種感知融合的新的獲取方式，而語音交互作為天然的人機交互入口，勢必是對信息生態(tài)與未來生活的一種重構。

誠然，語音交互涉及了非常復雜的技術鏈條，包括了聲學處理、語音識別、語義理解和語音合成等核心技術。需要產業(yè)鏈上下游相互合作，需要產業(yè)伙伴相互合作。目前，美國頂尖的科技公司，INTEL、ARM、谷歌、亞馬遜、Facebook等都紛紛牽頭成立了自己的產業(yè)聯盟。

隨著智能語音交互領域不斷發(fā)展，國際化的競爭也會日趨激烈。如何積極搶占全球智能語音交互的主導權？必然是組成產業(yè)技術創(chuàng)新聯盟，把握國際標準的制定、積極做好專利戰(zhàn)略布局，才能緊抓國內外同步創(chuàng)新的契機，不再重復PC和移動互聯網時代的遺憾。

聲明：凡資訊來源注明為其他媒體來源的信息，均為轉載自其他媒體，并不代表本網站贊同其觀點，也不代表本網站對其真實性負責。您若對該文章內容有任何疑問或質疑，請立即與中國機器人網(www.baoxianwx.cn)聯系，本網站將迅速給您回應并做處理。
電話：021-39553798-8007

更多>相關專題

0 條相關評論

推薦圖文

機器人競選市長，是時	每日新聞迎來大批裁員
售價近3萬元的鼓掌機	“來自星星”的機器人

推薦專題

點擊排行

?

^{<blockquote id="taas4"></blockquote>}

• 臺灣福裕 FVL-2000VTC 立式車床系列硬軌	• 臺灣福裕 SMART-B1640 IV栓槽芯軸軟體功能說明
• 臺灣福裕 SMART-B1224 Ⅳ 磨床粉末冶金	• 臺灣福裕 SMART-B1640III 磨床粉末冶金
• 日本吉良 KIRA KN-40Hb 臥式加工中心鋁合金擠	• 臺灣造盛 CSL210 CSL250 290L330車床
• 臺灣北平萬能工具磨床鉆頭，端銑刀，車刀，圓	• 臺灣福裕FSG--12 16 20 ADIII全自動平面磨床
• 日本TECLOCK GX-700 國際橡膠硬度測試儀	• 日本TECLOCK 得樂 GX-700 國際橡膠硬度測試儀

国产精品久久久久久久小说,国产国产裸模裸模私拍视频,国产精品免费看久久久无码,风流少妇又紧又爽又丰满,国产精品,午夜福利

反思仿制Echo的熱潮：為什么國外巨頭要布局AI交互？

智能語音交互的行業(yè)標準之爭拉開帷幕

語音交互市場專利布局競爭更為激烈

谷歌開放音頻數據集，用意不言而喻

組建產業(yè)聯盟，試圖瓜分市場蛋糕

反思仿制Echo的熱潮：為什么國外巨頭要布局AI交互？

谷歌開放音頻數據集，用意不言而喻

組建產業(yè)聯盟，試圖瓜分市場蛋糕