熱搜： 佳士科技 irobot 工業(yè)機器人機器人 ABB 機器人產(chǎn)業(yè)聯(lián)盟發(fā)那科機械手碼垛機器人庫卡

以語音為代表的人機交互或許是未來硬件和機器人的標配

日期：2021-12-02 來源：36Kr 作者：angela 評論：0

2021年以來，機器人賽道受到資本熱捧。僅前10個月拿到融資的機器人項目就有299個，其中253個集中在C輪及以前，79個項目的融資額在億元人民幣以上。

天眼查數(shù)據(jù)還顯示，今年新增的機器人相關(guān)企業(yè)就超過10萬家。截至目前，我國有超過32萬家機器人相關(guān)企業(yè)（企業(yè)名稱或經(jīng)營范圍包含機器人）。在地域上，廣東省機器人相關(guān)企業(yè)最多，有超過7萬家，占比達22.02%。是第二名江蘇的近2倍。

所以在這個產(chǎn)業(yè)和資本雙重背景下，36氪于11月25日在深圳舉辦了超前體驗·機器人峰會。此次峰會邀請了眾多投資人、科學(xué)家、學(xué)者、優(yōu)秀創(chuàng)業(yè)者以及相關(guān)從業(yè)者，共同探討行業(yè)新趨勢，以及在新環(huán)境下如何讓技術(shù)走進大眾生活。嘉賓包括中國工程院院士譚建榮、達晨財智業(yè)務(wù)合伙人任俊熙、藍馳創(chuàng)投董事總經(jīng)理曹巍、阿里巴巴達摩院研究員付強、高仙機器人創(chuàng)始人兼CEO程昊天、大族機器人CEO王光能、未來機器人創(chuàng)始人李陸洋、云跡科技執(zhí)行總裁兼CTO林小俊等多位嘉賓。

“語音和多模態(tài)的人機交互會是以機器人為代表的智能硬件必備特征，實踐中首先要克服的是聲學(xué)的復(fù)雜性。”阿里達摩院擁有應(yīng)對不同聲學(xué)環(huán)境下的思路和技術(shù)鏈條。

以下是阿里達摩院的付強先生現(xiàn)場演講《復(fù)雜聲學(xué)環(huán)境下的語音交互》（經(jīng)編輯）：

其實在無論是智能硬件還是特指機器人這個行業(yè)，以語音為代表的人機交互是一個比較重要的特征。剛才我聽達晨財智的任總也提到無論是VR、AR、機器人還是別的一些行業(yè)，語音交互和知識圖譜的應(yīng)用，都是一個必選項。但是這種人機交互，特別是語音交互的技術(shù)在應(yīng)用上的問題在哪里？首先是不同的場景會遇到不同的聲學(xué)問題, 包括背景噪聲、混響等聲學(xué)環(huán)境特性的差異。

模組化是應(yīng)對各種碎片場景的一個常用的技術(shù)手段。這是什么意思呢？就是說我們希望能夠通過對聲學(xué)器件、操作系統(tǒng)、聲頻算法和交互應(yīng)用調(diào)度, 包括連接協(xié)議等做成從軟件到硬件的一體化封裝，去應(yīng)對不同的場景里的離散性的問題，使得方案更加得平臺化，與聲學(xué)和音頻相關(guān)的技術(shù)也能被沉淀。另一方面，就是提升跟客戶對接的效率，包括我們也提供二次編程能力。

剛才我們講了應(yīng)對不同的聲學(xué)場景下的思路和技術(shù)棧，接下來介紹阿里達摩院的整個語音AI技術(shù)棧。一個標準的語音交互鏈路，端上首先是有信號處理，然后是語音喚醒, 本地識別等，還有服務(wù)智能硬件所不可缺少的聲學(xué)設(shè)計配套。云端的語音服務(wù)主要就是識別、合成、對話管理，還有聲紋相關(guān)的技術(shù)棧等，這些構(gòu)成了一個完整的從端到云的技術(shù)鏈。

下面逐一介紹一下整個技術(shù)鏈條上我們一些關(guān)鍵技術(shù)的突破，主要是近期比較著重打造的東西。

首先講聲學(xué)前端，這一塊是跟場景，硬件適配最前端的一個接口。在我們這個方案里，比較重要的特色是強調(diào)了信號處理的重要性，如果說大家可能熟悉這個領(lǐng)域中的一些技術(shù)的前沿成果的話，可能會關(guān)注到比如說深度學(xué)習(xí)技術(shù)對交互中的滲透，但是從我們的實踐和對這個行業(yè)的理解來看，在相當一段時間內(nèi)經(jīng)典信號處理里的作用一定會被保留。這是為什么呢？就是我們講到的場景的復(fù)雜性，不是說通過較為單一的場景的樣本的數(shù)據(jù)就能獲得全場景的聲學(xué)環(huán)境適配能力, 經(jīng)典信號處理理論存在這這里的意義在于在線的自適應(yīng)優(yōu)化，這是“魂”。

在這個前提之下，我們著重發(fā)展一些我們有特色的信號處理相關(guān)的技術(shù)，比如說盲源分離，它的特點是什么？就是比較適合小陣列，在消費電子行業(yè)里，當麥克風(fēng)的個數(shù)不能夠太多但是性能要求又比較高這樣的場景，這是選擇這一路線的基礎(chǔ)依據(jù)。特別是我們前期的工作，把它形成了以盲源分離理論為核心的對環(huán)境噪聲、房間混響和設(shè)備回聲的統(tǒng)一處理框架, 也是我們在該領(lǐng)域應(yīng)用研究層面的學(xué)術(shù)貢獻。由相關(guān)理論支撐的AEC算法甚至還在由國際權(quán)威學(xué)術(shù)機構(gòu)組織的挑戰(zhàn)賽上拿到國內(nèi)第一的成績。

接下來是高抗噪的視覺聽覺多模態(tài)融合技術(shù)，視覺的融合對于聽覺來講是一個更好的補充。在業(yè)內(nèi)來講，我們的多模態(tài)融合技術(shù)是走向?qū)嵺`比較早的，我們2018年就跟上海地鐵合作，在地鐵這個場景里首次把多模態(tài)語音交互技術(shù)用到了實踐。

回到方案層面，剛剛講了聲學(xué)的這種模組化，我們在近幾年時間內(nèi)提煉出來幾套應(yīng)對不同場景的模組方案：

第一個，我們講高性價比，這是是什么意思呢？舉個例子，比如說智能音箱、家電等，對成本要求比較敏感，對性能要求也比較嚴苛，追求高性價比的場景。

第二個，就是高性能，這個性能主要體現(xiàn)在對噪聲環(huán)境的魯棒性。

第三個，就是多模態(tài)，這里的多模態(tài)的, 更多還是指處理復(fù)雜聲學(xué)場景的技術(shù)能力。

還有一點，就是芯片化，也是我們模組化的一個極致表現(xiàn), 只有算法和芯片設(shè)計有機融合, 才能產(chǎn)生極致性價比的解決方案, 后面也有一些應(yīng)用案例。

接下來講講我們語音技術(shù)的幾個落地案例。過去幾年我們的語音交互技術(shù)和方案以軟核形式落地了海爾、康佳，還有一些與優(yōu)酷合作的投影儀等跟與家庭場景相關(guān)的智能硬件, 同時也提供了拾音模組和聲學(xué)結(jié)構(gòu)的參考設(shè)計, 包括業(yè)內(nèi)唯一的聲學(xué)裝配效果產(chǎn)線專業(yè)測試設(shè)備。從規(guī)模上來講，幾年下來大約有近千萬級累計裝機量, 從客戶的滿意度調(diào)查反饋上, 也顯示出小陣列條件下難得的較強抗賣場環(huán)境噪聲能力。

接下來，就是我剛剛講的高性價比的模組和芯片的一些落地案例，這里面包括喜馬拉雅的音箱，以及它的AI早教機，這是一種兒童教育硬件，也算是一種小型的機器人。然后就是與天貓精靈一起合作的車載精靈和兩輪電動車。客戶是對該芯片的選擇, 首要的一點就是高性價比這一主打特點。這個特點的形成是由包括從端側(cè)算法的路線選擇, 與平頭哥團隊共同進行的算法深度工程優(yōu)化和根據(jù)算法定義硬核算子等多方面的努力得到的結(jié)果。同時也包括我們整體的售后技術(shù)支持和產(chǎn)品持續(xù)升級能力。

高性能語音模組方案是和天貓精靈合作并落地的，第一個產(chǎn)品就是科沃斯掃地機N9+，也是業(yè)內(nèi)第一臺能在行進過程中進行語音交互的掃地機, 在今年6.18上市。它克服的問題是什么呢？是高自噪、大回聲，移動遠場和低算力等技術(shù)挑戰(zhàn)。該方案在掃地機行業(yè)的推廣應(yīng)用正在進行中, 同時我們在該場景下, 更低資源需求和更高性能的版本也即將發(fā)布。第二個案例就是這個機器狗，它本身噪音倒沒有那么大，但是它應(yīng)用場景可能是比較嘈雜的，它經(jīng)常在一些展會等較吵鬧的公眾場景做演示。比如今年云棲大會上, 就在有公司內(nèi)外的一些重要領(lǐng)導(dǎo)和嘉賓圍觀的情況下, 順利完成了所有的人機交互動作演示。

下面講講多模態(tài)交互技術(shù)的應(yīng)用，就是靠純聲學(xué)不能解決問題的時候，需要依靠音視頻融合的技術(shù)和方案。從2018年開始在上海地鐵全面落地，到近幾年北京，哈爾濱、南京、成都等城市的地鐵里，由于我們的推動，你會看到新開的地鐵線里，語音交互已然成為購票機的標配。當然，現(xiàn)在這個技術(shù)不僅僅是用在購票這個場景，更多的是在交互服務(wù)機器人或者服務(wù)大屏的智能查詢，比如說醫(yī)院的導(dǎo)診，政務(wù)、金融這些問詢場景。這種非接觸的語音交互，在疫情的背景下，也會是一個逐漸強烈的需求。

另外兩個案例，一個是跟釘釘合作的智能無人前臺，大家都知道考勤機, 這個算是考勤機的一個智能版本，我直接說出我想找誰，通過企業(yè)通訊錄的數(shù)據(jù)匹配, 然后它就可以直接視頻通話，來去替代前臺人工的服務(wù)，這也算是前臺服務(wù)機器人的一個表現(xiàn)形式。右邊這個本來是一個視頻，但是今天沒有時間去展示，我就簡單說一下，這其實是一個語音自助售貨機，展示的理念就是一方面它能夠做語音的交互，另一方面它有主動交互的功能，售貨機能自動打招呼，檢測你是男性女性，還有年齡大小，能主動給你做產(chǎn)品的推介，吸引你過來。我相信在機器人這個場景里，主動交互也是一個非常有價值的技術(shù)。

聲明：凡資訊來源注明為其他媒體來源的信息，均為轉(zhuǎn)載自其他媒體，并不代表本網(wǎng)站贊同其觀點，也不代表本網(wǎng)站對其真實性負責(zé)。您若對該文章內(nèi)容有任何疑問或質(zhì)疑，請立即與中國機器人網(wǎng)(www.baoxianwx.cn)聯(lián)系，本網(wǎng)站將迅速給您回應(yīng)并做處理。
電話：021-39553798-8007

更多>相關(guān)資訊

0 條相關(guān)評論

推薦圖文

機器人賦能產(chǎn)業(yè)，智贏	機器人也會創(chuàng)造英國
2018年中國智慧機場行	智能工廠全面解讀！
艾貓早教機器人亮相20	360智能硬件助力美國

推薦資訊

點擊排行

?

• 5G+AR加持晨星機器人掀起“智能化+人機交互”	• 科沃斯加碼人機交互技術(shù)——“硬科技”升級服務(wù)
• 人工智能：認知戰(zhàn)的制勝刀鋒	• 人工智能，中國企業(yè)該如何走向浪潮之巔
• 人機交互對人工智能至關(guān)重要人類可能會成為瓶	• 首家！機器人“入職”河南銷售
• 首爾科學(xué)家3D打印多功能軟件傳感器可實現(xiàn)人機交	• 人機交互掌控未來 2019深圳國際全觸與顯示展領(lǐng)
• 智能語音機器人技術(shù)不斷發(fā)展人機交互逐漸步入	• Humatics推出了用于人機交互的空間智能平臺

恰佩克獎	機器人高峰論壇	北大機器人	金屬加工在線	AI中國網(wǎng)	埃森焊接展	機氣林
工博會	趕考網(wǎng)	中國機床網(wǎng)	ITES深圳工業(yè)展	電氣自動化網(wǎng)	高壓電氣網(wǎng)	人工智能機器人
亞洲工業(yè)網(wǎng)	二手設(shè)備網(wǎng)	庫卡機器人	中國傳動網(wǎng)	華北機床網(wǎng)	數(shù)控機床市場網(wǎng)	國家標準化委員會

国产精品久久久久久久小说,国产国产裸模裸模私拍视频,国产精品免费看久久久无码,风流少妇又紧又爽又丰满,国产精品,午夜福利

以語音為代表的人機交互或許是未來硬件和機器人的標配