国产精品久久久久久久小说,国产国产裸模裸模私拍视频,国产精品免费看久久久无码,风流少妇又紧又爽又丰满,国产精品,午夜福利

熱搜: 佳士科技  irobot  工業(yè)機器人  機器人  ABB  機器人產(chǎn)業(yè)聯(lián)盟  發(fā)那科  庫卡  碼垛機器人  機械手 

Alexa語音王國迅速擴張的今天,它最大的挑戰(zhàn)是什么?

   日期:2017-08-11     來源:36氪    作者:dc136     評論:0    
   導讀:從1990年代開始,George Anders就在關注亞馬遜,他為美國刊物寫了許多與亞馬遜有關的文章。最近他出了一本書《你可以做任何事》( You Can Do Anything)。 George Anders刊文介紹了Alexa,既談到了Alexa的發(fā)展,也談到了它的挑戰(zhàn)。通過這篇文章,我們可以看到一個不同的Alexa王國。下面是文章的節(jié)選,有縮減:
 
  2012年8月31日,4名亞馬遜工程師提交一份專利申請文件,它最終變成了Alexa,這是一套AI系統(tǒng),它可以處理世界上最大、最復雜的數(shù)據(jù)集:人類語音。
 
  工程師只需要11個單詞、一張簡單的圖表就可以解釋它是如何運行的。一名男用戶在安靜的房間說:“請播放《Let It Be》,披頭士的音樂。”一臺小小的桌面機器回答說:“沒問題,John。”然后它開始播放指定歌曲。
 
  自此之后,面向家庭的語音AI成為亞馬遜的大業(yè)務,對于競爭對手而言,它也漸漸成為重要的戰(zhàn)略戰(zhàn)場。谷歌、蘋果、三星、微軟都投入了成千上萬的研究人員和業(yè)務專家,它們都想開發(fā)容易使用的設備,讓我們與設備對話。
 
  Witlingo公司開發(fā)語音App,為銀行、大學、律師事務所及其它機構開發(fā),Witlingo的CEO Ahmed Bouzid認為:“到目前為止,我們所有人必須屈從于技術,比如輸入、觸擊、滑動?,F(xiàn)在新用戶界面卻屈服于我們。”
 
  自2014年推出以來,Alexa設備銷售了幾千萬臺。在美國語音AI設備市場,亞馬遜估計占了總銷量的70%,雖然競爭壓力越來越大。谷歌Home也賣了幾百萬臺,蘋果與微軟很快也會推出自己的產(chǎn)品。
 
  最終,企業(yè)的目標是抓住3個市場機會:家庭自動化,家庭娛樂,購物。
 
  就目前來說,亞馬遜無意從制造設備的企業(yè)手中獲得收入,也就是制造智能恒溫器、燈泡、其它Alexa聯(lián)網(wǎng)設備的企業(yè)。未來,我們可以想像亞馬遜會與企業(yè)達成營收分成協(xié)議,或者選擇其它付費方式。
 
  在這3個市場中最小的是家庭自動化市場,每年開支超過50億美元,去年美國的零售銷售額總計約為4.9萬億美元。眼下亞馬遜通過銷售機器賺錢,定價介于50-230美元,最低端的Dots只要50美元,高端的Echos要230美元,上面有視頻顯示屏。
 
  有些企業(yè)正在開發(fā)硬件、開發(fā)服務,這些硬件與服務兼容Alexa。例如Capital One,它向銀行客戶銷售Alexa支付系統(tǒng);多倫多Ecobee制造Alexa智能恒溫器,用戶只需要說幾個單詞就可以調(diào)高或者調(diào)低房間溫度。
 
  Ecobee CEO Stuart Lombard說:“我們的客戶生活很忙碌。”現(xiàn)在該公司銷售Alexa設備有40%的營收來自海外,Ecobee成立已經(jīng)10年,Alexa設備是公司增長最快的產(chǎn)品線。
 
  Stuart Lombard還說:“客戶必須穿過繁忙的交通車流回到家里,他們必須喂孩子,必須給孩子換尿布,還要干其它各種事。我們讓他們將事情做完,不需要用到手,他們可以用手干其它事。”
 
  當語音遇到AI
 
  語音AI面臨很大的技術挑戰(zhàn),因為我們說話時并不是井然有序的,我們會干擾自己,想法會動搖,我們使用單詞的方式很奇怪,還會點頭,發(fā)出咕噥聲,我們會假設自己的話是有意義的,實際上沒有。
 
  幾千名亞馬遜員工正在解決這個問題,包括西雅圖、Sunnyvale、加州、劍橋、馬薩諸塞的研究中心。盡管如此,亞馬遜還嫌不夠,最近它為1100多個Alexa職位招募員工,涉及到十多個部門,當中有215個職位提供給機器學習專家。在劍橋辦公室內(nèi),Alexa首席科學家羅希特·普拉薩德(Rohit Prasad)接受了媒體采訪,他解釋了自己的團隊為何需要這么多人。
 
  普拉薩德說:“你提問的每一個方面都讓我發(fā)笑。”沉思幾秒之后,普拉薩德解釋說,他在語音技術方面研究了20年,在這段漫長歲月的大多數(shù)時間里,進展緩慢讓他感到沮喪。但在過去5年里巨大的機會開放了。創(chuàng)造一個真實高效的語音AI是一項復雜的、從未被征服的任務。
 
  在過去的歲月里,語音科學家一直想解決一件事,理解混亂表達的意義,最開始時表達有些混亂,很難搞清表達的意思,有了機器學習這樣的新方法,我們用不同的策略取得進步,最開始時匹配是不完美的,機器人從不完美著手,然后通過臨時猜測不斷優(yōu)化。
 
  關鍵在于消化大量的數(shù)據(jù),從早期的錯誤中學習。Alexa與用戶相處的時間越多,收集的數(shù)據(jù)也就越多,可以學習的數(shù)據(jù)也就越多,也就會變得越聰明。進步越大機會越大,這個過程需要大量的人力。
 
  這就是普拉薩德的解釋。
Alexa語音王國迅速擴張的今天,它最大的挑戰(zhàn)是什么?
  普拉薩德說:“讓我舉個例子。如果你問Alexa:‘Adele的第一張專輯是什么?’回答應該是‘19’。如果你說:‘播放它。’Alexa足夠聰明,知道播放那張專輯。”
 
  如果你在中間加入其它一些話,如果你問Alexa這張專輯是哪年發(fā)行的,賣了多少張,會怎樣呢?將問題替換“播放它”這個命令,早先的Alexa處理不了?,F(xiàn)在技術可以跟著思考前進,至少某些時候是可以的,它知道“它”指的是“19”。
 
  這是一個重要進步,進步歸功于機器學習,之前 Alxea也被無數(shù)的交換難住,機器學習可以從失敗中學習經(jīng)驗。系統(tǒng)知道用戶不想聽什么歌曲,知道之前的對話最早在何時談到這首音樂。
 
  MIT口語語言系統(tǒng)研究團隊的主管James Glass說:“人們會以何種方式要求獲得一些東西,你最開始時要做出假定。然后你要收集數(shù)據(jù),調(diào)校模型。”
 
  Glass說,這種類型的機器學習方法得到了廣泛的認可,不過要讓它運行需要大量數(shù)據(jù),遠不是大學研究人員輕易就能獲得的。
 
  由于Alexa的崛起,亞馬遜現(xiàn)在可以獲得大量的人機語音交互信息。2016年,Alexa引進一個龐大的數(shù)據(jù)庫,里面全是歌曲歌詞,有了這個數(shù)據(jù)庫,當用戶要求播放歌詞中帶‘drove my Chevy to the levee’的歌曲時,系統(tǒng)知道用戶要的是Don McLean的歌曲《American Pie》。
 
  普拉薩德正在推行一個新項目,這個項目的關注重點就是新方法的靈活性。具體來講就是用戶撤銷最初的請求時,系統(tǒng)要正確識別。用戶使用的“信號短語”是大不相同的。一組人說:“不,不,不。”還有一組說:“取消它。”第三組人說的話類似于“等等,實際上我想要的是……”,形式有所變化。Alexa沒有必要破解每一種表達。有了大量的樣本和半監(jiān)督機器學習技術,系統(tǒng)可以為否定語音找到大量可能的標記,請求改變之后能挑選出明確的新請求。
 
  為了讓Alexa成為更好的傾聽者,亞馬遜AI專家首先用大量數(shù)據(jù)訓練系統(tǒng),讓它成為更好的說話者,他們對機器合成的女性聲音進行優(yōu)化,讓節(jié)奏更完美,這樣就可以刺激用戶持續(xù)使用。
 
  如果使用的是傳統(tǒng)方法,一般會錄制大量的人類語音片段,然后依賴片段合成語音。使用這種技術可以生成更自然的聲音,但是無法低語、無法諷刺、無法調(diào)整,而人類許多時候會這樣說話。
 
  為了讓Alxea可以處理一切任務,既可以進行活躍的對話,也可以完成平靜的朗誦,亞馬遜機器學習算法采用了不同的方法,它用專業(yè)解說員的聲音訓練系統(tǒng),這些聲音有的焦急、有的充滿憂慮。亞馬遜旗下有一家公司Audible,它是有聲讀物出版商,這家公司幫了大忙。
 
  有太多想說的東西
 
  有些人是語音AI的熱心用戶,那就是無法在平板手機上輕松輸入的人。Gavin Kerr是Inglis的CEO,這家公司向殘疾人提供住房和服務,公司已經(jīng)在8戶居民的家中安裝了Echo和Dot設備。
 
  如果測試完成,Gavin Kerr希望300多位居民全能安裝,這是公司的全部客戶。Kerr說:“它為居民帶來了難以置信的好處,他們可以過得更舒適,可以獲得獨立性。”
 
  Kerr與幾百人合作,這些人患有硬化癥或者其它日漸讓人衰弱的疾病。有些人臥床不起,或者坐在輪椅上,因為很難碰到墻壁上的恒溫器,他們深感苦惱。
 
  Kerr解釋說:“他們的身體難以適應溫度。呆在華氏72度的房間內(nèi),前一小時可能會覺得太熱了,后一小時又覺得太冷了。”因為移動能力受到限制,他們很難讓自己過得舒服,如果沒有全天候援助,他們會過得更困難。
 
  稍加修改,Alexa軟件可以用特定語音提供服務。有一名男子,快40歲了,他想離開長期看護機構,回到日常社區(qū)生活。Kerr回憶說:“他告訴我:‘我沒有辦法使用Alexa語音命令。’我問他:‘你能說什么?’然后我們就修改了軟件,可以讓他按自己的方式用語音控制設備。現(xiàn)在他如果要打開廚房燈泡會說‘Mom’,如果想打開浴室燈會說‘John’。”
 
  Inglis為自己的Echo用戶提供培訓,時間只有4小時,許多新用戶會進一步探索。從盒子里拿出Echo,包裝會告訴用戶一些常見的操作指令,比如播放音樂、設置鬧鐘、更新購物清單。
 
  用戶可以在智能手機、平板上調(diào)用Alexa控制面板,調(diào)整設置,還可以下載新App,面板還會引導用戶,看看哪種提示音能讓App的工作變得更好。
 
  每周(有時頻率更高)Alexa總經(jīng)理羅勃·普契尼(Rob Pulciani)都會查看統(tǒng)計數(shù)據(jù),這些數(shù)據(jù)可以告訴他Alexa、Dot用戶最常用的表達是怎樣的。一般來說,清單中排名靠前的表達都是想獲得音樂、新聞、天氣信息、交通信息、游戲。今年春天,有一個請求迅速爬升,這是一個短語:“Alexa,幫我放松一下。”
 
  當用戶提出這樣的請求時,系統(tǒng)會播放一些聲音安撫用戶。可能是鳥叫,可能是波浪輕敲海濱,可能是貨運車穿過黑夜。如果用戶愿意,這些噪音式的環(huán)境聲會連續(xù)播放幾小時。
 
  2015年,當類似的App出現(xiàn)在Alexa平臺時,普契尼覺得純粹只是搞怪。不過這些App很快就吸引了一大堆用戶。壓力大的成年人聽著這些聲音入睡,父母將它們當成搖籃曲,安撫古怪的嬰兒。發(fā)現(xiàn)這一趨勢之后沒過幾周,普契尼就與同事對Alexa的內(nèi)容架構進行調(diào)整,這樣一來當新用戶問系統(tǒng)有什么新“技能”可以嘗試時,他們能夠快速找到讓人放松的聲音。
 
  持續(xù)對話
 
  谷歌、蘋果、微軟、亞馬遜的AI平臺有著不同的優(yōu)勢。谷歌助手在搜索指令方面表現(xiàn)最好。蘋果Siri和微軟Cortana有其它一些優(yōu)點。至于Alexa,它的購物指令特別出色。
 
  如果語音AI想獲得最終勝利,必須與用戶進行交流,這種交流長達幾分鐘,非常真實。任務艱巨,機器的能力必須很強大,能夠判斷人類說話者的意圖,甚至能夠識別不明顯的請求。
 
  當朋友說:“我?guī)字軟]有去健身房了。”人類知道他的意思可能是想談談壓力或者自尊。對于AI軟件而言,這種意圖很難明白。突然轉換話題,AI也很難跟得上節(jié)奏。
 
  為了與下一代AI、語音研究人員建立更強的聯(lián)系,一年前亞馬遜邀請幾十所大學的工程學學生開發(fā)語音機器人,亞馬遜要求機器人可以完成20分鐘的對話。在11月截止日期之前突破最大的學校將會拿到50萬美元獎金。
 
  我花了一周時間對將近5款機器人程序進行測試,每一次都從簡單的問題開始,然后進入巧妙的開放式陳述,陳述的只是觀點,回應有很多的可能性。開始時還是不錯的,機器會問你:“看了最近上映的電影嗎?”我說:“看了。我們看了 《隱藏人物》(Hidden Figures)。”
 
  這部電影講述的是NASA成立之初的故事,接下來,聊天機器人模仿報紙對電影發(fā)表評論,它說:“我認為在實際數(shù)學方面《隱藏人物》有點淺薄。”我對這部電影沒有這樣的感覺,看起來這樣表述對于AI程序而言還是很不錯的。很快對話就進行不下去了,不過至少還有之前剎那的美妙時光。
 
  可惜,沒有一款聊天機器人程序能夠完成任務。最讓人困惑的是機器會說:“你喜歡路邊餐飲嗎?”而測試時我們談的卻是網(wǎng)站。
 
  幾天后,我問普拉薩德,讓他談談對社交機器人的看法,早期的失敗沒有困擾他。普拉薩德說:“這是一個超級重要的領域。如果達到這樣的水平,那么Alexa將是非常聰明的。要達到很難,比圍棋或者國際象棋難。在這些游戲中雖然可能性的棋步很多,但是我們知道最終目標是什么。如果是對話,你不知道對方想達成怎樣的目的。”如果Alexa能夠解決這個問題,我們就可以與它真正對話了。
 
 
更多>相關資訊
0相關評論

推薦圖文
推薦資訊
點擊排行