“在足球場上,對手的出現(xiàn)使得一切變得復(fù)雜起來。”法國哲學(xué)家讓-保羅·薩特(Jean-PaulSartre)的這句話適用于多個領(lǐng)域,無論是團體項目的戰(zhàn)術(shù)策略,還是微觀經(jīng)濟學(xué)中的博弈論模型,亦或是大規(guī)模爆發(fā)的機器人之戰(zhàn)。

Gliders2016榮獲2016年7月在德國萊比錫舉辦的2016機器人世界杯冠軍
來自澳大利亞的Gliders2016球隊的一記決勝進球
魚群,圖片來源geek.com
對手的出現(xiàn)讓一切都變得不同了:在相互對抗的局面下,再細致的準備都有被打亂陣腳的可能。
以上結(jié)論在多個領(lǐng)域其實都是適用的。無論是戰(zhàn)術(shù)策略的制定,還是繪制施工藍圖,中途一旦遇上未知的境況(例如對手重新調(diào)整的策略,或是自然災(zāi)害等不可抗力),無論之前的準備是多么細致入微,考慮的是多么周全,都有可能全部土崩瓦解。
因此,讓一個復(fù)雜系統(tǒng)具有應(yīng)對突變情況的能力有多重實現(xiàn)方法,其中一個可行的思路是賦予系統(tǒng)的每個組件以自適應(yīng)能力,即讓每個組件都能進行自我調(diào)整以應(yīng)對突發(fā)狀況。

而這么做的缺點也顯而易見,被孤立看待的每個組成部分都只會分析各自的行為模式,但這樣的分析是很難判斷整個系統(tǒng)的動向的。
那么能否找到方法,來預(yù)測不可知的突發(fā)狀況?這是研究復(fù)雜系統(tǒng)的科學(xué)家在設(shè)計系統(tǒng)抗干擾性和抗打擊性時所面臨的核心問題。
最早提出復(fù)雜系統(tǒng)這一概念的,是美國學(xué)者霍蘭。他提出“適應(yīng)性造就復(fù)雜性”,并于1994年引入了復(fù)雜適應(yīng)性系統(tǒng)(CAS:complex adaptive system)的概念。
復(fù)雜性系統(tǒng)的研究方法有別于傳統(tǒng)的理論研究,以計算機仿真作為主要研究工具。其主要特點有:
自適應(yīng)性/自組織性(self-adaptative/self-organization)
復(fù)雜系統(tǒng)能夠通過不斷學(xué)習,調(diào)整自身的結(jié)構(gòu)和行為,以適應(yīng)外部和內(nèi)部的變化。
而且各組件之間,以及組件與環(huán)境之間會發(fā)生各種交互作用。正是這種自主性和復(fù)雜性,使得復(fù)雜系統(tǒng)具備了不斷演化的動力。
演化能力(evolution)
復(fù)雜系統(tǒng)由簡單元素組合,通過對外界環(huán)境和狀態(tài)的預(yù)期—適應(yīng)—自組織過程,經(jīng)過不斷演化,實現(xiàn)了從功能到結(jié)構(gòu)的升級。
人工智能的演化
足球比賽就是一個演示復(fù)雜系統(tǒng)的很好的模型。機器人世界杯(RoboCup),顧名思義,是機器人的世界杯。這一比賽即將迎來20周年紀念日,最近的賽事吸引了來自超過45個國家的逾40,000選手和觀眾。
該賽事同時也是人工智能,機器人研發(fā),以及多智能主體復(fù)雜系統(tǒng)(multi-agent complex systems)發(fā)展的的風向標。
2016年德國萊比錫機器人世界杯2D仿真組總決賽,2016年7月3日,紅隊是來自悉尼大學(xué)&CSIFO組成的澳大利亞隊Gliders2016,黃隊是來自福岡大學(xué)和大阪府立大學(xué)組成的日本隊HELIOS2016
一邊是實體組(physical robot leagues)戰(zhàn)得如火如荼叫好叫座,另一邊仿真組(simulationleague)則將精力集中在AI的升級迭代上。

在仿真組的比賽中,兩只球隊的各11名“隊員”均為程序自主控制,馳騁在一個二維的虛擬球場上,整個過程中“球員”無人工操作。20多年來,機器人世界杯社區(qū)為選手們提供開源模擬器以及可視化軟件,共計近百萬行代碼。
每個虛擬“球員”都具備虛擬的全方位視覺,聽覺以及觸覺,能夠“感知”周遭發(fā)生的一切。與此同時,每一位“球員”還具備基本的行動能力,如跑動,轉(zhuǎn)身,踢球。
最大的挑戰(zhàn)是,如何推演出可行的最佳策略,來應(yīng)付對手突如其來的干擾性動作。
每走一步耗時十分之一秒,在此期間,所有的感官馬達全權(quán)負責一個“球員”的信息鏈,將接受到的新的環(huán)境信息進行處理,在約100,000個選項之中權(quán)衡利弊,然后將敲定的指令傳達給該“球員”。

“球員”思路示意圖
2016年7月,來自澳大利亞的Gliders2016榮獲冠軍,這是悉尼大學(xué)Mikhail Prokopenko教授以及Victor Jauregui教授,聯(lián)合CSIFO的Peter Wang,OliverObst教授通力合作的成果。

Gliders2016榮獲2016年7月在德國萊比錫舉辦的2016機器人世界杯冠軍
為了最大化的提升球隊的實力,科學(xué)家使用了基于人類演化的計算策略。以迭代的方式進行創(chuàng)新,展開測試,檢驗場上動作,提高比賽表現(xiàn)。
若干個超級計算機群每天執(zhí)行成千上萬次的路徑演算,用以檢測評估“球員”的實力。
路徑總數(shù)接近一千萬。
高屋建瓴
在測試中,不僅需要考察每個“球員”的實力,評估整個“球隊”的表現(xiàn),還需要高屋建瓴地進行戰(zhàn)略考量。
從研究對手戰(zhàn)術(shù)的復(fù)雜程度著手,考察我方“隊員”的場上靈活性,戰(zhàn)術(shù)延展性以及戰(zhàn)略適應(yīng)性。
與此同時,還要考慮到對手接下來有可能走出的奇招怪局,以及我方“隊員”是否能夠在局勢不利的情況下力挽狂瀾。

來自澳大利亞的Gliders2016球隊的一記決勝進球
前文所述,牽涉到復(fù)雜系統(tǒng)的一般性問題。因此必須考慮到初始條件的細微變化,諸如傳球中的“冒險系數(shù)”的增加對比賽結(jié)果的影響。
另一個研究重點集中在,系統(tǒng)在運行過程中,是否會傾向于重復(fù)的特定軌跡,及隨機算法的效用。因此,必須考慮模擬器中隱藏變量的建模。
一言以蔽之,就是在復(fù)雜系統(tǒng)下,一個冠軍隊伍所必需具備的素質(zhì)。
來自大自然的啟示
自然界的魚群和鳥群如何躲避捕食者體現(xiàn)了生物群落的復(fù)雜性??蒲袌F隊從觀察中獲取靈感,并將靈感應(yīng)用在戰(zhàn)術(shù)中。

魚群,圖片來源geek.com
面對捕食者,魚群迅速形成復(fù)雜的空間聚合,如此一來,即便是小小的擾動也能以極快的速度傳遍整個群體,傳達性命攸關(guān)的警示。
回到機器人世界杯上。同樣的道理,場上的“球員”能夠在以很高的連貫性“跑動”的同時,根據(jù)場上情況不斷調(diào)整自身位置,以便策應(yīng)隊友/堵截對手。而且,這樣的移動不是突然的、毫無預(yù)示的,而是連貫的,協(xié)調(diào)的。
針對不同對手,需要不同的戰(zhàn)術(shù)。行動路徑越復(fù)雜,“球隊”的作戰(zhàn)能力以及防御能力越強。
借助信息理論,定量和預(yù)測系統(tǒng)中的“信息流”而不是“數(shù)據(jù)流”,來評估“球隊”場上表現(xiàn)。不同于“數(shù)據(jù)流”,信息流突出了相關(guān)性和可行性最高的動作。
機器人世界杯的復(fù)雜性會隨著時間的推移而增加,比賽將面臨新的挑戰(zhàn),解決新的問題,科技也會不斷進步。
機器人世界杯第二個二十年的旅程,將會由全新一代的科學(xué)家來主導(dǎo)。
到那時,復(fù)雜系統(tǒng)作為一塊研究領(lǐng)域,很可能主導(dǎo)全球的教育,會結(jié)合信息科技的新元素,以及物理,生物,和數(shù)學(xué),引領(lǐng)未來的工程,科學(xué)和商業(yè)人才。