最初,只是一連串缺乏連貫的聲音在絮絮不休。但幾分鐘以后,突然冒出一個(gè)完整的單詞:“red”(紅色)。接著是另一個(gè):“box”(盒子)。牙牙學(xué)語的機(jī)器人就是這樣僅僅通過和人類閑聊而學(xué)會了說第一個(gè)真切實(shí)在的單詞。這一進(jìn)展可望讓機(jī)器人以更酷似人類、更合乎人性的方式說話,同時(shí)也有助于解開嬰兒最初是如何開始理解語言的奧秘。
出生6~14個(gè)月的幼嬰,正處于從模糊地吐露音節(jié)向表達(dá)實(shí)際詞語過渡的階段,這是掌握一門完整語言中必不可少的步驟。有些被視為“靠山”的單詞一旦得以確立,就會提供單詞可能始于哪里和止于哪里的線索,從而使孩童更容易開口學(xué)習(xí)說話。
受這個(gè)過程的啟示,英國赫特福德郡大學(xué)計(jì)算機(jī)科學(xué)家卡羅琳·萊昂率領(lǐng)的團(tuán)隊(duì)利用英語中近4萬個(gè)音節(jié),給取名DeeChee的幼兒型機(jī)器人編制了一款程序。它允許機(jī)器人通過對音節(jié)的隨意串連,更像一名嬰兒似的牙牙學(xué)語。
研究人員還征募了34名志愿者充當(dāng)教師,要求他們把DeeChee當(dāng)作孩童一般看待。DeeChee同每位教師展開了長達(dá)8分鐘的對話。它的存儲器在每次對話的間隙都會被保存、擦掉和復(fù)位,以便于重新開始和每一位教師的試驗(yàn)。每次對話伊始,DeeChee詞典中的全部音節(jié)均注有一個(gè)完全相同的計(jì)分。
上課一開始,所有這些設(shè)置都會改變。DeeChee將按先聆聽、后講話這一輪值編程將教師的話語轉(zhuǎn)變成音節(jié),同時(shí)計(jì)算每個(gè)音節(jié)出現(xiàn)次數(shù)的總和。然后,它會更新自身詞典中的計(jì)分,給教師用過的音節(jié)添加額外的打分。它在下一次開口說話時(shí)更有可能重復(fù)教師說過的音節(jié),因?yàn)檫@些音節(jié)此刻擁有更高的計(jì)分。
萊昂認(rèn)為,這一點(diǎn)很像人類的嬰兒。“他們只要聽到頻發(fā)的聲音就會變得異常敏感”,萊昂說,“他們寧愿沿用已經(jīng)熟悉的慣例。”教師在DeeChee說出可辨認(rèn)的單詞時(shí)所給予的鼓勵(lì)性點(diǎn)評,更是強(qiáng)化了這種以模仿為特征的學(xué)習(xí)效果。DeeChee會按照程序檢測這些評語,給得到教師贊許的音節(jié)標(biāo)上額外的計(jì)分。有些無意義的音節(jié)得到額外計(jì)分是不可避免的。但隨著這一過程的重復(fù),只有構(gòu)成單詞的音節(jié)才會不斷地出現(xiàn)在受到贊許的串行里。
8分鐘快要結(jié)束了,盡管機(jī)器人仍會發(fā)出無意義的音節(jié),但實(shí)際單詞的出現(xiàn)頻率仍會高于它假如依然隨機(jī)選擇音節(jié)的場合。據(jù)萊昂解釋,運(yùn)用一種并非語言所特有的統(tǒng)計(jì)學(xué)習(xí)法,即可讓單詞從牙牙學(xué)語中脫穎而出,表明在這個(gè)語言學(xué)習(xí)階段并不需要密切相關(guān)的語法技能。荷蘭蒂爾堡大學(xué)認(rèn)知科學(xué)家保羅·福格特對此留下了深刻的印象:“這是非常有意思的第一步,將來可以讓機(jī)器人幫助我們學(xué)習(xí)語言。”DeeChee眼下的語言能力遠(yuǎn)不是完善的,但從牙牙學(xué)語起步可能是研制談吐自然的機(jī)器人的最佳途徑。“要做到這一點(diǎn),就得從頭開始教它。”萊昂說。
當(dāng)然,并非所有的單詞都是“生來”平等的。研究人員在教DeeChee學(xué)習(xí)基本說話能力時(shí)發(fā)現(xiàn),它偏愛某些單詞遠(yuǎn)甚于其他詞類。例如有關(guān)形狀和顏色的單詞,包括“紅色”、“綠色”、“心臟”、“正方形”和“盒子”,其出現(xiàn)頻率似乎常會大于“the”(冠詞)或“and”(和)。萊昂說,“and”或“the”使用非常頻繁,但有時(shí)候會受到另一個(gè)單詞的擠壓而變得難以辨析。“紅色”或“綠色”等顯眼的單詞,不管出現(xiàn)在句子的哪個(gè)部位往往都是同樣引人注目的。萊昂團(tuán)隊(duì)認(rèn)為,這種差異可能有助于兒童學(xué)習(xí),因?yàn)檫@些單詞對于幼齡而言具有更高的“信息價(jià)值”。