我想用幾個(gè)例子來(lái)講一講,人類走過(guò)了幾千年的實(shí)驗(yàn)科學(xué)、幾百年的理論科學(xué),保險(xiǎn)是一個(gè)很傳統(tǒng)的行業(yè),基于概念評(píng)估的生意,保險(xiǎn)公司對(duì)車險(xiǎn)客戶是這樣聚類的:A類連續(xù)兩年沒(méi)有出車禍的,B類,最近一年沒(méi)有出車禍的,C類過(guò)去一年出了一次車禍的,D類過(guò)去一年出了兩此及以上車禍的。我從機(jī)場(chǎng)到深圳來(lái),你坐飛機(jī)從北京到深圳,保險(xiǎn)公司給你付了,我一了解,這個(gè)保險(xiǎn)是20塊錢,這個(gè)保險(xiǎn)公司買了你三個(gè)大數(shù)據(jù),身份證,還有你的手機(jī)號(hào),各位企業(yè)、各位領(lǐng)導(dǎo),各位老百姓,你們想一想。
物聯(lián)網(wǎng)時(shí)代,當(dāng)汽車成為輪式機(jī)器人,成為大數(shù)據(jù)發(fā)生器以后,就是一個(gè)大數(shù)據(jù)發(fā)生體,每一次駕駛,每一次維修,每一次行駛,甚至每一次剎車,都會(huì)記錄在岸,利用大數(shù)據(jù)聚類,保險(xiǎn)公司可對(duì)一個(gè)車況好、駕駛習(xí)慣好、常走線路事故率低,不勤開(kāi)車的特定客戶,給予更大的優(yōu)惠,而對(duì)風(fēng)險(xiǎn)太高的客戶報(bào)高價(jià)甚至拒絕,例如出租車司機(jī)跑的比老百姓多得多,總之能夠給出包括保險(xiǎn)費(fèi)支付方式在內(nèi)的個(gè)性化解決方案,這就顛覆了保險(xiǎn)公司的傳統(tǒng)商業(yè)模式。這就是大數(shù)據(jù)聚類成為保險(xiǎn)公司的核心競(jìng)爭(zhēng)力,我擴(kuò)張一下,就是大數(shù)據(jù)聚類成為很多行業(yè)的核心競(jìng)爭(zhēng)力。
非大數(shù)據(jù)時(shí)代,做一個(gè)人臉的識(shí)別,我們可以提取它十個(gè)特征,第二類先結(jié)構(gòu)化存起來(lái),你想一想,如果十個(gè)特征都一樣的話,兩個(gè)人是不是同一個(gè)人呢?當(dāng)然,這也是不可能的,但是我們?cè)傧胍幌?,人類智能?lái)看,它忽略了什么呢?我認(rèn)為它忽略了太多,這種人臉識(shí)別僅僅是幾何結(jié)構(gòu)的聚類,落入集合學(xué)框架,忽略了聚類的不確定性,忽略了聚類的多樣性等等。
再舉個(gè)例子,大數(shù)據(jù)寫詩(shī),人們熟讀眾多詩(shī)詞,記住了針對(duì)各種意境的大量字串。例如說(shuō)李白一生寫詩(shī)1010首,把他所有詩(shī)句進(jìn)行機(jī)械切割。李白給毛主席誕辰100周年寫一首詩(shī),就是這樣。
大數(shù)據(jù)對(duì)形式化方法的挑戰(zhàn)是非常嚴(yán)峻的,在數(shù)據(jù)密集型的網(wǎng)絡(luò)時(shí)代,任何傳統(tǒng)學(xué)科,或者傳統(tǒng)的行業(yè),它的公理、原理和定理組成的語(yǔ)境,遇到互聯(lián)網(wǎng)+的挑戰(zhàn)之后,這樣一來(lái),傳統(tǒng)的學(xué)科行業(yè),或者是交叉學(xué)科,成為一個(gè)大數(shù)據(jù)、小模型、小定律、交叉學(xué)科的時(shí)代,模型和程序要圍繞數(shù)據(jù)轉(zhuǎn)。
創(chuàng)新,表示在創(chuàng)造一個(gè)新的語(yǔ)境,新的坐標(biāo)系,在這個(gè)坐標(biāo)系下研究大數(shù)據(jù),在互聯(lián)網(wǎng)情況下,如何創(chuàng)造你新的坐標(biāo)系,新的語(yǔ)境,否則難以有新的發(fā)現(xiàn)。
實(shí)踐中的研究,由下而上要深入,數(shù)據(jù)要?jiǎng)龠^(guò)程序,價(jià)值要?jiǎng)龠^(guò)知識(shí),關(guān)聯(lián)要?jiǎng)龠^(guò)因果,更多要關(guān)注有意義的小眾,把這些小眾累積起來(lái)才成為大眾。
通過(guò)大數(shù)據(jù)聚類即時(shí)發(fā)現(xiàn)價(jià)值,要充分認(rèn)識(shí)大數(shù)據(jù)中的不確定性和價(jià)值的隱蔽性。
機(jī)器人如何認(rèn)知是我講的第二個(gè)問(wèn)題,這七個(gè)字,可以有兩種劃分,一種是機(jī)器人如何認(rèn)知,你要把這個(gè)弄清楚,我覺(jué)得實(shí)際上是在弄這個(gè),機(jī)器人在想,人如何認(rèn)知,智能機(jī)器人是集新材料、新工藝、新能源、機(jī)械、電子、移動(dòng)通信、全球定位導(dǎo)航、移動(dòng)互聯(lián)網(wǎng)、云計(jì)算、大數(shù)據(jù)、自動(dòng)化、人工智能、認(rèn)知科學(xué)、乃至人文藝術(shù)等多個(gè)學(xué)科、多種技術(shù)于一身的人造精靈,是人聯(lián)網(wǎng)、物聯(lián)網(wǎng)不可或缺的端設(shè)備,是人類社會(huì)走向智慧生活的重要伴侶。
機(jī)器人既是使用大數(shù)據(jù)也產(chǎn)生大數(shù)據(jù),既是大數(shù)據(jù)的產(chǎn)物,也是大數(shù)據(jù)的推動(dòng)者,機(jī)器人是大數(shù)據(jù)的認(rèn)知的典型代表,機(jī)器人時(shí)代真的來(lái)了,我們希望我們以后的黃牛退休、鐵牛耕地,這個(gè)鐵牛就是機(jī)器人,農(nóng)民進(jìn)城,機(jī)器人耕地,醫(yī)療與健康機(jī)器人,服務(wù)機(jī)器人更是上上下下,當(dāng)然還有太空機(jī)器人等。
我先講一下服務(wù)機(jī)器人,高考機(jī)器人,就是由知識(shí)的碎片化,大數(shù)據(jù)來(lái)認(rèn)知,就說(shuō)明我們的教育不能光是填知識(shí),我們現(xiàn)在做一個(gè)報(bào)告,我們可以用機(jī)器人來(lái)撰稿,機(jī)器人導(dǎo)航,機(jī)器人手術(shù)等。