前段時(shí)間由于疫情的關(guān)系,老師和學(xué)生們都在家里上網(wǎng)課。除了視頻授課,老師也會(huì)通過(guò)文字或語(yǔ)音進(jìn)行教學(xué)指導(dǎo)工作。你可曾想過(guò)那個(gè)對(duì)你語(yǔ)重心長(zhǎng)講解知識(shí)點(diǎn),在你快走神時(shí)突然來(lái)個(gè)段子,以及拿著小鞭子催你做作業(yè)的老師可能是個(gè)機(jī)器人?

這個(gè)場(chǎng)景已不再天馬行空,人工智能正變得越來(lái)越真假難辨。截止目前為止,已有多個(gè)聊天機(jī)器人被判定成功通過(guò)了圖靈測(cè)試,而虛擬教師這個(gè)概念也早在幾十年前就已被提出。
教育界早有共識(shí),由經(jīng)驗(yàn)豐富的老師進(jìn)行一對(duì)一個(gè)性化輔導(dǎo)是最佳的教育方式,然而這種方式受限于高成本和高人力,很難大規(guī)模推廣(如圖)。

教學(xué)質(zhì)量和商業(yè)效率是個(gè)悖論,好老師就那么多,老師精力也有限,所以僅有少數(shù)家庭可以負(fù)擔(dān)的起一對(duì)一的輔導(dǎo),這也涉及到了教育公平性的問(wèn)題。
虛擬教師(以教育聊天機(jī)器人為代表)的出現(xiàn)恰恰可以解決這個(gè)問(wèn)題:Ta可以同時(shí)教授成千上萬(wàn)名的學(xué)生,可以隨時(shí)隨地回答學(xué)生的問(wèn)題,還可以因材施教提供個(gè)性化輔導(dǎo)。除此之外,學(xué)生學(xué)習(xí)數(shù)據(jù)的積累,還可以反過(guò)來(lái)對(duì)教學(xué)本身提供建議與幫助(如圖)。

今天,硅谷洞察將詳解虛擬教師背后的技術(shù),介紹全球4個(gè)頂尖的虛擬教師解決方案案例,以及分析整個(gè)行業(yè)在用戶體驗(yàn)、商業(yè)模式方面的現(xiàn)狀和挑戰(zhàn)。
虛擬教師背后的技術(shù)是什么?
第一個(gè)虛擬教師系統(tǒng)誕生于1960年,可以展示教學(xué)材料,問(wèn)學(xué)生問(wèn)題并即時(shí)反饋,但是因?yàn)槌绦蚴蔷幩赖模耶?dāng)時(shí)計(jì)算機(jī)也并不普遍,各方面成本都太高,所以僅僅是作為研發(fā)機(jī)構(gòu)的項(xiàng)目。七八十年代,基于規(guī)則模型(rule-based)的對(duì)話和認(rèn)知理論開始被應(yīng)用于虛擬教師系統(tǒng)中,機(jī)器人已可以通過(guò)給學(xué)生提示,引導(dǎo)學(xué)生逐步解決問(wèn)題。
規(guī)則模型指的是對(duì)話經(jīng)過(guò)預(yù)定義的規(guī)則處理,根據(jù)規(guī)則生成文本來(lái)進(jìn)行回復(fù)。打個(gè)比方,機(jī)器人問(wèn)學(xué)生昨天學(xué)的什么(0),學(xué)生說(shuō)行星(0=行星),而機(jī)器人已經(jīng)有了這個(gè)方面的規(guī)則,則會(huì)接下來(lái)展開針對(duì)性的對(duì)話:“那你可以告訴我0的定義嗎?”
基于這種模式,對(duì)話越復(fù)雜所要求的規(guī)則就越多,而且機(jī)器人并非真正理解學(xué)生的意圖,而是抓取學(xué)生對(duì)話中的關(guān)鍵詞,所以無(wú)法生成有意義的自然語(yǔ)言對(duì)話。在對(duì)話的走向上,大多數(shù)虛擬教師系統(tǒng)基于決策樹,所有的教學(xué)路徑都是被預(yù)設(shè)好,然后根據(jù)學(xué)生的學(xué)習(xí)表現(xiàn)走向不同的可能性。

隨后,檢索模型(Retrieval based)開始被應(yīng)用于學(xué)生答疑和學(xué)生服務(wù)中。這個(gè)模型有點(diǎn)像搜索匹配:學(xué)生提問(wèn)后,機(jī)器人在知識(shí)庫(kù)里搜尋并選出最匹配的答案回答學(xué)生。
打個(gè)比方,學(xué)生說(shuō) “海水怎么是咸的呢”,機(jī)器人則會(huì)在庫(kù)里檢索到最相似的問(wèn)題“海水為什么是咸的”,從而給出該問(wèn)題的答案。相似度分?jǐn)?shù)的計(jì)算是技術(shù)重點(diǎn),可以通過(guò)詞匯權(quán)重(同一個(gè)詞出現(xiàn)的頻率)、編輯距離(兩句話相差的字?jǐn)?shù))、分類與實(shí)體(判斷每句話的主題和關(guān)鍵詞)等方面來(lái)評(píng)定。
除了上述兩種模型,近些年比較熱門的生成模型(Generation-based)更為智能,它像一個(gè)翻譯機(jī),但不是把一種語(yǔ)言翻譯成另一種語(yǔ)言,而是把學(xué)生說(shuō)的話逐詞解碼,再逐詞翻譯成機(jī)器人的答復(fù)(如圖)。然而因?yàn)檫^(guò)于靈活,輸出結(jié)果難以把控,有時(shí)會(huì)生成過(guò)于寬泛甚至無(wú)意義的答復(fù),所以在教育領(lǐng)域中的實(shí)際應(yīng)用較少,僅僅是作為規(guī)則模型和檢索模型的補(bǔ)充。

相較于規(guī)則模型更多依賴于手工,檢索模型和生成模式可以利用機(jī)器學(xué)習(xí)和深度學(xué)習(xí)技術(shù)來(lái)降低人力成本。教育工作者寫好的回答集、真實(shí)場(chǎng)景下老師和學(xué)生的教學(xué)對(duì)話、人類和機(jī)器人之前的對(duì)話都是比較好的訓(xùn)練數(shù)據(jù)。
另外,相較于使用手工的決策樹來(lái)引導(dǎo)對(duì)話的走向,機(jī)器學(xué)習(xí)中的強(qiáng)化學(xué)習(xí)(Reinforcement learning)和獎(jiǎng)賞系統(tǒng)( Rewarding system)可以通過(guò)計(jì)算學(xué)生達(dá)到目標(biāo)的可能性的分?jǐn)?shù),自動(dòng)引導(dǎo)學(xué)生走向那條最匹配的路徑,從而最有效地完成學(xué)習(xí)目標(biāo)。
打個(gè)比方,當(dāng)機(jī)器人問(wèn)學(xué)生達(dá)芬奇的代表作是什么?學(xué)生回答:巖間圣母。決策樹往往是預(yù)先設(shè)計(jì)好了分叉:正確的答案走向?qū)υ捖窂紸,錯(cuò)誤的答案走向?qū)υ捖窂紹,不知道走向?qū)υ捖窂紺。而在獎(jiǎng)賞系統(tǒng)里,因?yàn)楸敬握n程的教學(xué)目標(biāo)是分析蒙娜麗莎的構(gòu)圖,所以機(jī)器人會(huì)把可能的答復(fù)進(jìn)行打分排序,比如可能的答復(fù)有“完全正確!你知道巖間圣母有兩副嗎?”,“完全正確!你還知道達(dá)芬奇其它的代表作嗎?”,“完全正確!不過(guò)達(dá)芬奇最最著名的畫還要屬蒙娜麗莎。”“答錯(cuò)了,再試試看?給你個(gè)提示,是四個(gè)字。”最終根據(jù)分?jǐn)?shù),“完全正確!不過(guò)達(dá)芬奇最最著名的畫還要屬蒙娜麗莎。”因?yàn)榭梢砸龑?dǎo)學(xué)生到今日的主題-蒙娜麗莎的構(gòu)圖,從而最好的實(shí)現(xiàn)教學(xué)目標(biāo),所以排名最高,對(duì)話管理器最終選擇了這個(gè)作為答復(fù)。

圖片來(lái)自網(wǎng)絡(luò)
活躍在全球虛擬教師賽道上的,有科技巨頭,也有新生的初創(chuàng)公司。下面就讓筆者以IBM的Watson Tutor,硅谷人工智能教育科技公司Cognii,挪威的教育公司EdTech Foundry的產(chǎn)品Differ,以及美國(guó)人工智能教育初創(chuàng)公司DMAI的產(chǎn)品MAIA為例,來(lái)一展這個(gè)賽道上的領(lǐng)跑者所處的狀態(tài)。
虛擬教師Watson Tutor由IBM和教育機(jī)構(gòu)Pearson強(qiáng)強(qiáng)聯(lián)手,通過(guò)認(rèn)知技術(shù)打造。它可以以口語(yǔ)化的方式隨時(shí)隨地為學(xué)生提供幫助與建議,同時(shí)為老師提供一些數(shù)據(jù)分析,比如學(xué)生對(duì)每個(gè)知識(shí)點(diǎn)的掌握情況,有哪些興趣點(diǎn)、疑難點(diǎn)以及長(zhǎng)短板,方便老師更好的管理和改進(jìn)課程。
研究數(shù)據(jù)顯示,40%的美國(guó)公立學(xué)校的學(xué)生無(wú)法按時(shí)完成課業(yè),而Watson Tutor為學(xué)生要么順利完成課業(yè),要么放棄課業(yè)提供了一個(gè)中間選項(xiàng)。相較于以前學(xué)生可能因?yàn)椴缓靡馑蓟蚴翘闊┒茨芟蚶蠋煂で髱椭琖atson Tutor因?yàn)樗矫芎头奖愕奶攸c(diǎn),可以最大化學(xué)生尋求幫助的可能。大學(xué)老師不會(huì)24小時(shí)全天候呆在每個(gè)學(xué)生身邊進(jìn)行指導(dǎo),而對(duì)于Watson Tutor,學(xué)生在閱讀學(xué)習(xí)資料時(shí)只需簡(jiǎn)單地問(wèn)一句:“Watson,你可以幫我解釋下這段話嗎?”
Watson Tutor主要有三個(gè)功能環(huán)節(jié)。診斷環(huán)節(jié):機(jī)器人根據(jù)學(xué)生的回復(fù),以提示、反饋、解釋、和確認(rèn)為普遍的概念錯(cuò)誤這幾種方式來(lái)引導(dǎo)學(xué)生完成學(xué)習(xí)部分。答疑環(huán)節(jié):機(jī)器人通過(guò)檢索模型(retrieval based)搜索相關(guān)信息和延展資料,來(lái)建立新知識(shí)和學(xué)生已掌握知識(shí)之間的關(guān)聯(lián)。最后的測(cè)試環(huán)節(jié):通過(guò)向?qū)W生提問(wèn)來(lái)評(píng)估學(xué)生對(duì)知識(shí)點(diǎn)的理解程度。
技術(shù)上,Watson Tutor基于DBT(virtual dialog-based tutor)系統(tǒng),該系統(tǒng)有幾個(gè)核心因素:通過(guò)自然語(yǔ)言處理(NLP )技術(shù)來(lái)解釋學(xué)生的意圖并作出合適的反饋;使用一種對(duì)話策略來(lái)保證學(xué)生的參與度和推動(dòng)學(xué)習(xí)進(jìn)展:通過(guò)對(duì)話狀態(tài)對(duì)學(xué)習(xí)者的能力進(jìn)行建模,并決定如何開展對(duì)話可以更好地激發(fā)其學(xué)習(xí)興趣;最后是機(jī)器人的性格設(shè)計(jì)。
在對(duì)話策略的設(shè)計(jì)上,每組對(duì)話都有一個(gè)主要學(xué)習(xí)目標(biāo)。每個(gè)學(xué)習(xí)目標(biāo)由一個(gè)主要問(wèn)題和幾個(gè)相關(guān)問(wèn)題組成,主要問(wèn)題包含多個(gè)提示。學(xué)生首先會(huì)接觸到學(xué)習(xí)目標(biāo)中的主要問(wèn)題,學(xué)生回答完畢后,虛擬教師會(huì)和相關(guān)答案進(jìn)行比對(duì),并根據(jù)不同的情況相應(yīng)作出反應(yīng):如果學(xué)生部分沒(méi)答對(duì),會(huì)提供一些提示;如果學(xué)生對(duì)該目標(biāo)完全摸不著頭腦,則會(huì)引導(dǎo)學(xué)生去完成更低一級(jí)的學(xué)習(xí)目標(biāo);如果學(xué)生在更低一級(jí)目標(biāo)的表現(xiàn)良好,可以重新返回到之前的目標(biāo)。
在這個(gè)過(guò)程中,通過(guò)對(duì)學(xué)生情況的動(dòng)態(tài)調(diào)整,Watson Tutor可以幫助學(xué)生更順利地掌握知識(shí)。一般一組對(duì)話是4-15輪(學(xué)生和機(jī)器人對(duì)話的一個(gè)來(lái)回算作一輪),有些情況下可能高達(dá)30-40輪。
Watson Tutor還向人類老師學(xué)習(xí)了一些軟技能,比如如何引發(fā)一場(chǎng)討論,如何促進(jìn)學(xué)生思考,以及如何提供情感支持。除了知識(shí)點(diǎn)本身的傳授,這些軟技能讓學(xué)生感受到了更多的支持與關(guān)懷,從而更能愿意表達(dá),也更能接受虛擬老師的批評(píng)和指正。

下面,筆者將介紹來(lái)自3個(gè)頂尖初創(chuàng)公司的虛擬教師解決方案。以及分析整個(gè)行業(yè)在用戶體驗(yàn)、商業(yè)模式方面的現(xiàn)狀和挑戰(zhàn),同時(shí)從技術(shù)角度分析虛擬教師進(jìn)一步發(fā)展的人才需求和挑戰(zhàn)。