国产精品久久久久久久小说,国产国产裸模裸模私拍视频,国产精品免费看久久久无码,风流少妇又紧又爽又丰满,国产精品,午夜福利

熱搜: 發(fā)那科機(jī)器人  工業(yè)  機(jī)器人  上海  ABB機(jī)器人  自動(dòng)化  工業(yè)機(jī)器人  工業(yè)機(jī)器人展  機(jī)器  展會(huì) 

讓 Siri 的聲音更像真人,蘋果是如何做到的?

   日期:2017-09-11     來源:36氪    作者:dc136     評(píng)論:0    
    虛擬助手最先是由Siri帶火的,但現(xiàn)在的蘋果已經(jīng)被Amazon和Google拖到后面。不過以追求完美為目標(biāo)的蘋果自然不會(huì)就這么讓Siri沉寂下去,過去幾年的時(shí)間了,蘋果的團(tuán)隊(duì)一直在攻關(guān)一個(gè)項(xiàng)目,那就是讓Siri說話更像人。團(tuán)隊(duì)負(fù)責(zé)人認(rèn)為,現(xiàn)在Siri已經(jīng)取得了巨大飛躍,在不久后的iOS 11中,用戶就能感受到它的風(fēng)采了。Siri說話是怎么變得更像人的呢?《連線》雜志的這篇文章為我們揭秘。
讓 Siri 的聲音更像真人,蘋果是如何做到的?
  Alex Acero第一次看《她》的時(shí)候是以一個(gè)正常人的方式去觀看的。但第二次的時(shí)候,他根本就沒有看電影。Acero是蘋果負(fù)責(zé)Siri背后技術(shù)的主管,這次他就坐在那里,緊閉雙眼,傾聽Scarlett Johansson(斯嘉麗·約翰遜)是如何給她的人工智能角色Samantha配音的。他注意了她是如何跟Joaquin Phoenix扮演的Theodore Twombly交談的,以及Twombly是如何回話的。Acero試圖弄清楚Samantha是怎么讓一個(gè)從來都沒見過她的人愛上她的。
 
  為什么聲音會(huì)工作得那么好?當(dāng)我問到Acero這方面他了解到什么東西時(shí),他笑了,因?yàn)榇鸢柑黠@了。他說:“因?yàn)樽匀唬∫驗(yàn)槟遣皇菣C(jī)器人!”這對(duì)于Acero來說幾乎都算不上是啟示。這基本上只是確認(rèn)了他的團(tuán)隊(duì)過去幾年做的項(xiàng)目是對(duì)的:這個(gè)項(xiàng)目的目標(biāo)就是讓Siri聽起來更像人。
 
  今秋,當(dāng)全球各地安裝iOS 11的iPhone和iPad數(shù)量達(dá)到數(shù)百萬的時(shí)候,該新軟件就會(huì)給Siri換一個(gè)新的聲音。它不會(huì)引入很多新功能或者把笑話講得更好笑,但是你會(huì)注意到其中的不同。Siri現(xiàn)在講話會(huì)有更多的停頓,在停頓前先把音節(jié)拉長(zhǎng),說起來有一種抑揚(yáng)頓挫的感覺。字句聽起來更加流利,并且Siri也會(huì)講更多語言了。總之,聽它講和跟它講都感覺更好了。
 
  蘋果用了幾年的時(shí)間來重新構(gòu)建Siri背后的技術(shù),將它從一個(gè)虛擬助手變成了支撐你手機(jī)的一切人工智能的一個(gè)包羅萬象的統(tǒng)稱。它已經(jīng)在不懈地?cái)U(kuò)張到新的國家和語言(盡管犯過不少錯(cuò)誤,但Siri仍然是目前市面上最通俗的個(gè)人助理)。蘋果也從一開始的慢慢地到現(xiàn)在的迅速地,致力于將Siri普及到每一個(gè)地方。而且Siri現(xiàn)在已經(jīng)歸蘋果的軟件負(fù)責(zé)人Craig Federighi掌管,這表明Siri對(duì)蘋果的重要性現(xiàn)在已經(jīng)跟iOS相提并論。
 
  這項(xiàng)技術(shù)好到能讓你跟你的虛擬助手墜入愛河還需要一段時(shí)間。但Acero和他的團(tuán)隊(duì)認(rèn)為自己已經(jīng)取得了一次巨大飛躍。他們還堅(jiān)定地認(rèn)為,如果自己能讓Siri說話不那么像機(jī)器人而更像你認(rèn)識(shí)和信任的某人的話,他們就能把Siri做得很棒,哪怕Siri會(huì)有失敗的時(shí)候(注:因?yàn)槿艘矔?huì)犯錯(cuò))。而這個(gè)在AI和語音技術(shù)尚處早期階段時(shí),可能就是最佳場(chǎng)景了。
 
  Siri長(zhǎng)大了
 
  為什么蘋果喜歡控制自己產(chǎn)品的一切?如果你想找個(gè)好例子的話,只需看看Siri。自從推出6年后,Siri在這場(chǎng)虛擬助理的競(jìng)賽中大部分已經(jīng)落后。Amazon的Alexa得到了更多的開發(fā)者支持;Google的Assistant知道更多的東西;這兩個(gè)在很多不同公司許多類型的設(shè)備上都能找到。
 
  蘋果說這都是自己的錯(cuò)。Siri剛推出的時(shí)候,是另一家公司提供語音識(shí)別的后端技術(shù)。那家公司是誰?一切跡象均指向了Nuance,盡管蘋果和Nuance均從未承認(rèn)過有合作關(guān)系。不管這家公司是誰,蘋果都樂于把Siri的早期問題歸咎到它的身上。蘋果負(fù)責(zé)產(chǎn)品營銷的CP Greg Joswiak說:“這就像是在賽跑,有人在拖我們后腿。” Joswiak說蘋果已經(jīng)給Siri制訂了一個(gè)大計(jì)劃:“做你可以在手機(jī)上對(duì)話的助理,可以用更容易的方式幫你做這些事,”只是技術(shù)還不夠好。他說:“你懂的,輸入不行的話,輸出也不行。”
 
  幾年前,Acero領(lǐng)導(dǎo)的這支蘋果團(tuán)隊(duì)控制著Siri的后端以及體驗(yàn)改進(jìn)?,F(xiàn)在Siri的基礎(chǔ)已經(jīng)變成深度學(xué)習(xí)和AI,因此得到了巨大改進(jìn)。Siri的裸語音識(shí)別可以與任何競(jìng)爭(zhēng)對(duì)手匹敵,可正確識(shí)別95%的用戶講話。這款A(yù)I工作于兩個(gè)不同的關(guān)鍵模式:語音轉(zhuǎn)文本,也就是Siri弄清楚你說什么,以及文本轉(zhuǎn)語音,也就是Siri會(huì)進(jìn)行回話。
 
  在眾人的聲音中(尤其是當(dāng)這些系統(tǒng)變得愈發(fā)個(gè)性化時(shí))分辨你的語音是Siri最重要的工作之一。Siri掌握的數(shù)據(jù)越多,蘋果的模型就會(huì)越好,它就越能分辨不同的人,甚至能理解很重的口音。這還會(huì)變成一個(gè)安全問題:研究人員最近發(fā)現(xiàn),他們能夠以高到人類無法聽見的頻率跟Siri溝通,從而使得破解不被發(fā)現(xiàn)。Siri需要學(xué)會(huì)區(qū)分人和機(jī)器的語音,以及你的和別人的語音。
 
  學(xué)會(huì)講話
讓 Siri 的聲音更像真人,蘋果是如何做到的?
  有一個(gè)辦法有助于理解這些系統(tǒng)的工作方式,那就是看看蘋果是怎么教Siri學(xué)習(xí)新語言的。在把Siri引入新市場(chǎng)——比如說上海時(shí)——團(tuán)隊(duì)首先會(huì)尋找已有的本地語言數(shù)據(jù)庫。然后通過雇用配音員,讓這些人讀書、讀報(bào)以及讀網(wǎng)上的文章等來豐富這個(gè)庫。
 
  蘋果的團(tuán)隊(duì)會(huì)轉(zhuǎn)錄那些錄音,把單詞跟聲音對(duì)應(yīng)上——更重要的是,要識(shí)別音素,也就是構(gòu)成所有話語的獨(dú)立聲音(在英語中,“fourteen”是個(gè)單詞,而“e”這個(gè)英就是音素)。他們?cè)噲D以各種能想象得到的方式來捕捉這些音素:在詞尾的時(shí)候變?nèi)酰陂_始的時(shí)候加強(qiáng),停頓前拉長(zhǎng),疑問句末變成升調(diào)等。每一種表達(dá)都有著略為不同的聲波,蘋果的算法會(huì)對(duì)此進(jìn)行分析,找出任何特定句子的最合適表達(dá)方式。Siri說的每一句話都包含了幾十或者幾百個(gè)這樣的音素,就像是用不同雜志里面的字母拼湊出來的勒索信。你聽到Siri說的話里面可能沒有一個(gè)字是通過錄音出來的。
 
  再給個(gè)例子:“You want to watch this?(你想看這個(gè)嗎?)”和“I like your watch(我喜歡你的手表。)”第一句的情況下,Acero說到“watch”時(shí)聲音會(huì)自然提高,但是在第二句的時(shí)候就會(huì)變成降調(diào)。Acero說:“單詞還是一樣的單詞,但發(fā)音就完全不一樣了。”在這兩個(gè)句子中他都無法使用單詞“watch”的同一份錄音,或者甚至是相同的音素。“one Siiiix NINE fourteenth STREET PhilaDELphia”,發(fā)音就像你的老式GPS導(dǎo)航那樣的系統(tǒng)是很難聽的,尤其是單詞數(shù)量比較多時(shí)。
 
  即便在幾年前,計(jì)算機(jī)和服務(wù)器也還不能提供足夠的處理能力來遍歷一個(gè)龐大的數(shù)據(jù)庫,為每一次呼叫和響應(yīng)找到完美的聲音組合。不過現(xiàn)在他們可以了,Acero和他的團(tuán)隊(duì)想要到盡可能多的數(shù)據(jù)。所以在做出了初始模型之后,他們馬上就以所謂的“僅收聽模式”推出Siri。這種模式下你不能跟Siri對(duì)話,但是可以按下麥克風(fēng)按鈕然后下達(dá)語音指令或者進(jìn)行web搜索。這個(gè)給蘋果的機(jī)器提供了很多不同口音、不同品質(zhì)的麥克風(fēng)以及各種情況下的輸入,這一切都讓Siri做得比比人更好。蘋果收集(自稱是匿名模式下的)和轉(zhuǎn)錄這一數(shù)據(jù),然后改進(jìn)算法和訓(xùn)練神經(jīng)網(wǎng)絡(luò)。他們還給機(jī)器補(bǔ)充了位置相關(guān)數(shù)據(jù)以及說話習(xí)慣——比如3:0美國的說法是three-zero,而英國則是three-nil——然后繼續(xù)調(diào)整系統(tǒng),直到Siri對(duì)什么是上海話以及大家是怎么說上海話有著近乎完美的理解。
 
  與此同時(shí),蘋果還進(jìn)行了一場(chǎng)浩大的尋找合適配音員的行動(dòng)。他們從成百上千人開始,讓這些每個(gè)人都錄一段Siri可能會(huì)講到的話。然后Acero跟蘋果的設(shè)計(jì)師和用戶界面團(tuán)隊(duì)一起來決定最喜歡哪一個(gè)聲音。這一塊其決定作用的更多的是藝術(shù)而不是科學(xué)——他們一邊聽,一邊試圖找感覺,那種難以言喻的感覺,最好要有幫助感和親切感,中氣十足又不要太尖銳,有快樂感但又不能太卡通。
 
  接下來的部分就是科學(xué)了。Acero說:“很多配音員的聲音都很好聽,但這并不意味著這些聲音就適合于語音合成。”他們用自己建立的名為音素變異性的模型來對(duì)這些講話進(jìn)行測(cè)試,看看每一種細(xì)微的表達(dá)方式的聲波左右側(cè)的差異性如何。一個(gè)音素的變異性太多會(huì)使得把很多音素組合起來的時(shí)候很難發(fā)出自然的聲音,但你在聽它們講的時(shí)候是聽不出問題來的。只有計(jì)算機(jī)才能看出不同。Acero說:“這幾乎就像在墻上貼墻紙,你得留意接縫才能確保對(duì)齊。”
 
  在找到了發(fā)音同時(shí)令人和計(jì)算機(jī)感到滿意的那個(gè)人之后,蘋果用了幾周的時(shí)間去錄制聲音,然后這就成為了Siri的嗓音。Siri支持的21種語言(針對(duì)36個(gè)國家進(jìn)行本地化)都是按照這一流程進(jìn)行的——這個(gè)數(shù)量超過了其所有主要競(jìng)爭(zhēng)對(duì)手支持的語言之和。每個(gè)月加起來有3.75億人在使用Siri。這是個(gè)很大的數(shù)字,對(duì)于一個(gè)嚴(yán)重瑕疵數(shù)不勝數(shù),很多人直搖頭的語音助手來說更是如此。
 
  盡管如此,與全球10億多的蘋果設(shè)備相比這個(gè)數(shù)字仍略顯蒼白。從iPhone到Apple Watch,從Macbook到Apple TV,蘋果銷售的幾乎所有東西都包含有Siri。不過分析師預(yù)計(jì),很快就會(huì)有超過5億的iPhone會(huì)被同時(shí)激活。Siri是一個(gè)流行且重要的功能,但還算不上無所不在。對(duì)于大多數(shù)人來說,這個(gè)功能絕對(duì)不是必不可少的;你對(duì)Siri的功能需求并不像對(duì)手機(jī)的需要那樣?,F(xiàn)在蘋果已經(jīng)有了一位自己信任的助理,它必須教會(huì)大家怎么去用Siri。
 
  盡管問我吧
 
  蘋果推Siri的意圖是什么呢?你想知道的一切都可以在這則廣告https://36kr.com/p/5084887.html里面找到。影片跟蹤了Dwayne Johnson(巨石強(qiáng)森)在伙伴Siri陪伴下一天的生活。強(qiáng)森用Siri查看日程安排,用Siri打Lyft,當(dāng)然,開車的還是他;他還一邊飆車一邊查天氣;在西斯廷教堂畫壁畫的時(shí)候用Siri收郵件;在兩個(gè)手沒有空的時(shí)候用Siri進(jìn)行單位換算;在太空的時(shí)候進(jìn)行Facetime還拍了個(gè)自拍。Siri稱他是“Big、Bald和Beautiful先生”,希望這個(gè)聲音到iOS 11的時(shí)候聽起來不再那么的不舒服。
 
  Joswiak說,從一開始蘋果就希望Siri成為干臟活的機(jī)器。大家通過問一些瑣碎的問題來比較虛擬助理的方式令他感到發(fā)瘋,因?yàn)檫@使得Siri看起來很糟糕。他說:“我們?cè)O(shè)計(jì)Siri不是讓你打破砂鍋問到底的!”
 
  相反,Joswiak仍然專注于幫助大家在一位自動(dòng)化朋友的幫助下做更多的事。他指出Siri可以在Mac上執(zhí)行復(fù)雜的文件搜索,護(hù)著即將推出的HomePad對(duì)音樂的深厚知識(shí)。另一個(gè)例子出自我們見面的幾天之后,當(dāng)時(shí)Siri的語音搜索和控制贏得了艾美獎(jiǎng)的一項(xiàng)技術(shù)性獎(jiǎng)項(xiàng)。它可以下達(dá)一些非常出色的指令““嘿Siri,回放2分鐘,”然后你就能重新聽一遍。
 
  Siri不是萬能的,甚至大部分事情都不能做。它最有用的地方是可以讓你少敲幾個(gè)字,少滑動(dòng)幾次屏幕,而不是替你解決復(fù)雜的瑣事或者跟你辯論我們是不是生活在模擬世界里面。但因?yàn)镾iri展現(xiàn)出了沒有限制性——因?yàn)槟憧梢詥柸魏问虑?mdash;—用戶自然就想什么都試試。Acero說:“用戶知道自己可以說什么是很重要的。”他的工作之一就是要幫助Siri改善溝通技巧,同時(shí)在失敗的時(shí)候要表現(xiàn)得優(yōu)雅。他說:“我們?cè)谂x予Siri這類能力,也就是知道什么地方自己不知道。但這是個(gè)很困難的問題。”蘋果網(wǎng)站,甚至包括它的商業(yè)廣告,都是為了幫助大家更好地理解Siri可以做什么,不可以做什么。
 
  另一個(gè)挑戰(zhàn)是讓大家記得Siri在著呢。Acero說:“大家做事都有自己的習(xí)慣。如果習(xí)慣敲字,如果突然改變這一習(xí)慣的話,適應(yīng)是需要一段時(shí)間的。”所以蘋果試圖去推動(dòng)用戶朝著正確的方向走。在iOS 11里面,Siri的存在感會(huì)強(qiáng)很多,主動(dòng)性也會(huì)大大加強(qiáng)。它會(huì)觀察你瀏覽網(wǎng)頁然后推薦Apple News故事給你閱讀,或者幫助你替剛剛通過Groupon訂購的按摩券添加日程安排。新的Siri會(huì)變形,在設(shè)備兼同步你的設(shè)置,所以不管你在使用哪一種設(shè)備,Siri一直都會(huì)知道你的習(xí)慣。
 
  這些年來,蘋果在讓開發(fā)者跟Siri集成的事情上一直動(dòng)作緩慢。Alexa以及程度略低的Google Assistant都在鼓勵(lì)開發(fā)者替自己的助理開發(fā)應(yīng)用或者把他們的助理納入進(jìn)去,但Siri卻仍然對(duì)開發(fā)者緊閉大門。巨石強(qiáng)森能做的一切都只能在蘋果自己的應(yīng)用里面做。它拒絕承認(rèn)你手機(jī)上Google Maps或者Outlook的存在,當(dāng)然,沒有HomeKit的話你也開不了任何的燈。去年,該公司謹(jǐn)慎地開了一道縫,讓跟多的開發(fā)者進(jìn)入,使得用戶可以用Siri來跟Whatsapp通話,打Uber,或者通過Venmo轉(zhuǎn)賬。iOS 11之后大門會(huì)開得更大,但只是大一點(diǎn)點(diǎn)。
 
  隨著Amazon和Google取得開發(fā)者的支持以及在功能競(jìng)爭(zhēng)中取得領(lǐng)先,這種動(dòng)作之慢已經(jīng)讓蘋果付出了在大家眼里失去領(lǐng)先地位的代價(jià)。至少Joswiak是表示出耐心的。他說問題不在于Siri能做多少事情。而在于“你怎么把事情做對(duì)?因?yàn)槲覀儾幌雽?duì)用戶規(guī)約過多。” 他對(duì)Amazon和Google苛刻的語法要求感到憤怒,比方說你得這么說:“Alexa,問一下Daily Horoscopes有關(guān)金牛座的情況。”或者“OK,讓我跟Todoist談?wù)劇?rdquo;他寧愿等到你想怎么講就怎么講,不管你想要什么都能如愿的時(shí)候。蘋果一如既往的,如果只能做出半成品的話,寧愿什么也不做。
 
  語法問題最終要回到Acerco傾聽Samantha和Theodore Twombly在屏幕上談戀愛時(shí)聽到的同一樣?xùn)|西上。最好的計(jì)算機(jī)——即便是科幻小說里面的計(jì)算機(jī)——聽起來也像人。他說:“它會(huì)在合適的地方停頓,它會(huì)有合適的語調(diào),流暢的發(fā)音。而且聲音里面只有一點(diǎn)點(diǎn)的金屬感。”他希望做點(diǎn)好東西出來,然后提供給每個(gè)人。任何時(shí)候你想了解進(jìn)展情況時(shí),只需要看看Siri就行。
 
 
聲明:凡資訊來源注明為其他媒體來源的信息,均為轉(zhuǎn)載自其他媒體,并不代表本網(wǎng)站贊同其觀點(diǎn),也不代表本網(wǎng)站對(duì)其真實(shí)性負(fù)責(zé)。您若對(duì)該文章內(nèi)容有任何疑問或質(zhì)疑,請(qǐng)立即與中國機(jī)器人網(wǎng)(www.baoxianwx.cn)聯(lián)系,本網(wǎng)站將迅速給您回應(yīng)并做處理。
電話:021-39553798-8007
更多>相關(guān)專題
0相關(guān)評(píng)論

推薦圖文
推薦專題
點(diǎn)擊排行
?