通過模仿人類小孩學習語言的過程,計算機學家首次教會機器人說出實際的單詞。
一開始的時候,機器人寶寶只是發(fā)出一些語無倫次的噪音,但是幾分鐘后,它突然發(fā)出了完整清晰的單詞:“紅色”,接著另一個單詞:“盒子”。這樣只是通過與人類交流,呀呀學語的機器人首次說出實際的單詞。
這一機器人技術的飛躍發(fā)展可能有助于新型機器人的研發(fā),它能夠以一種更自然、類人的方式說話,同時也能夠揭示幼兒理解語言的奧秘。
幼兒在6個月大到14個月大之間,會從發(fā)出一些含糊不清的音節(jié)向能夠說出真正的單詞轉(zhuǎn)變,這是完全掌握語言的必要步驟。某些“錨”一樣的單詞一旦被建立,它們就提供了通往詞匯大門的線索,因此這時幼兒學說話也變得容易。
受到這種過程的啟示,一支由英國赫特福德大學計算機科學家凱若琳?萊恩(Caroline Lyon)帶領的團隊向他們的iCub仿人機器人迪奇編入程序,程序中幾乎包含了英語中所有的大約4000個音節(jié)。通過任意將音節(jié)組合在一起,迪奇可以像一個嬰兒那樣呀呀學語。
研究人員同時也招募了34個志愿者扮演老師的角色,他們被要求將迪奇當成是一個嬰兒。迪奇和每位老師有8分鐘的對話,在每段對話的間隙里,迪奇的記憶都被儲存、擦除和重啟,因此對于每位老師而言實驗都是重新開始的。在每段對話開始時,迪奇詞匯里每一個音節(jié)的分數(shù)都是完全相同的。
為詞匯計分
課程開始后,一切都改變了。迪奇內(nèi)部的程序設置是先聽老師的講話,然后再學著說,它把老師的講話變成一個一個的音節(jié),合計講話中的音節(jié)個數(shù)。然后更新它的詞匯分數(shù),給每個曾經(jīng)被老師用過的音節(jié)加分。當?shù)掀嫦乱淮沃v話的時候,由于這些音節(jié)的得分高,因此更可能被迪奇重復。
萊恩說這讓人聯(lián)想起人類嬰兒的學習方式,“當他們聽到頻繁出現(xiàn)的聲音時,他們就會對這些聲音變得敏感”,萊恩說,“他們更喜歡熟悉的聲音”。
當?shù)掀嬲f出可辨認的單詞的時候,老師就會給予得分獎勵,模仿學習通過這種方式得到提高。迪奇內(nèi)部的程序會檢測這些評論,并給予得到老師認可的音節(jié)額外的分數(shù)。當然不可避免的是,一些毫無意義的音節(jié)也會得到額外的得分。但是由于這種過程是不斷重復的,只有那些可以組成單詞的音節(jié)才能夠持續(xù)不斷地出現(xiàn)在獲得認可的單詞串中。
盡管迪奇依然會發(fā)出毫無意義的音節(jié),但是在8分鐘對話快結(jié)束的時候,實際單詞持續(xù)出現(xiàn)的頻率要比迪奇只是隨機選擇音節(jié)時的頻率高。
在呀呀學語的時候,學習單詞可以借助于一種基于統(tǒng)計的學習過程而不是具體的語法,這一事實證明了該階段的語言學習并不需要強調(diào)語法能力,萊恩說到。
荷蘭蒂爾堡大學的認知科學家保羅?沃格特對這一成果印象深刻,“對于開發(fā)能夠幫助我們學習語言的機器人而言,這是非常有趣的第一步,”
目前,迪奇的說話能力離完全成熟的語言表達還很遙遠,但是從呀呀學語開始可能是創(chuàng)造表達自然的機器人的最好方法。“如果你希望機器人能夠表達得自然,那你可能需要從最初開始教它”,萊恩說到。
唯一重要的因素
并不是所有單詞的組成都是相同的,當英國赫特福德大學凱若琳?萊恩的團隊教給機器人一些基本的單詞時,它更喜歡某些類型的單詞,比如描述形狀和色彩的單詞包括“紅色”、“綠色”、“心臟”、“方形”、“盒子”,它們比“這”或者“和”出現(xiàn)的更頻繁。萊恩說,老師在進行教導的時候,“這”、 “和”出現(xiàn)得很頻繁但是由于它們有時卻一起被其他單詞所遮蓋,這使得機器人很難辨認它們。而一些顯著的單詞比如“紅色”或者“綠色”,不管它們在句子的哪里出現(xiàn),它們的發(fā)音都傾向于一致。萊恩的團隊猜測,由于一些單詞對于年齡較小的孩子而言有著更高的“信息價值”,或許正是這一區(qū)別幫助孩子們最先學習它們。