說到人工智能,大多會(huì)聯(lián)想到聊天機(jī)器人、人臉識(shí)別、無人駕駛,但人工智能的應(yīng)用絕不僅只是停留在這些具象的前沿應(yīng)用場(chǎng)景上,就金融領(lǐng)域而言,人工智能還可以通過深度學(xué)習(xí)技術(shù)幫助金融機(jī)構(gòu)進(jìn)行反欺詐以及降低信用風(fēng)險(xiǎn)。
欺詐一直以來都是銀行業(yè)的主要風(fēng)險(xiǎn)之一。銀行零售業(yè)務(wù)反欺詐的本質(zhì)是對(duì)實(shí)施欺詐人員進(jìn)行偽造身份、聯(lián)系方式、設(shè)備信息、資產(chǎn)信息等虛假信息的識(shí)別。傳統(tǒng)銀行擁有上億萬級(jí)的信息數(shù)據(jù)庫,但由于缺乏有效的科技手段,傳統(tǒng)規(guī)則的經(jīng)驗(yàn)式反欺詐模型已無法應(yīng)對(duì)日益演進(jìn)的欺詐模式和欺詐技術(shù)。
傳統(tǒng)銀行反欺詐模型的局限
銀行經(jīng)過多年歷史數(shù)據(jù)沉淀,擁有大量的歷史違約和欺詐數(shù)據(jù),是反欺詐的重點(diǎn)聚焦領(lǐng)域。但對(duì)傳統(tǒng)銀行來說,一些傳統(tǒng)的反欺詐手段,無論在效率、有效性、全面性以及成本上都是銀行的短板,尤其隨著互聯(lián)網(wǎng)金融的興起,非現(xiàn)場(chǎng)交易增多,更是加劇了銀行風(fēng)險(xiǎn)防控的難度。
“小眾的欺詐事件越來越難以用商業(yè)經(jīng)驗(yàn)和確切規(guī)則描述出來,國內(nèi)目前的欺詐都是rule base(規(guī)則驅(qū)動(dòng))的,即憑借過往經(jīng)驗(yàn)和從此前發(fā)生過的事實(shí)中,抽象出系列規(guī)則,每一條規(guī)則觸發(fā)一種欺詐場(chǎng)景,交叉組合所施加的業(yè)務(wù)邏輯判斷,就構(gòu)成了欺詐模型,”天云大數(shù)據(jù)CEO雷濤在接受第一財(cái)經(jīng)采訪時(shí)表示。

“但在這個(gè)過程中,傳統(tǒng)規(guī)則的模型就會(huì)帶來很多問題,”雷濤表示,“申請(qǐng)欺詐就很難將一些難以描述的規(guī)則抽象出來。”
例如,團(tuán)伙在某村莊以招工的名義大量收取村民的身份證,并申請(qǐng)信用卡,然后刷卡透支,讓村民背負(fù)銀行債務(wù)。此時(shí),銀行按照過往經(jīng)驗(yàn)便會(huì)判定該村地址為欺詐地址,使該村村民抹上信用污點(diǎn),然而事實(shí)并非如此。因此,對(duì)于抽象的、難以描述的金融現(xiàn)象,便可以借助機(jī)器處理。
作為人工智能最重要的技術(shù)——機(jī)器的深度學(xué)習(xí),其最大價(jià)值就是能夠做特征表達(dá),通過一個(gè)數(shù)學(xué)的復(fù)雜結(jié)構(gòu)來表達(dá)一些以往很難描述的金融現(xiàn)象,因此特別適合處理風(fēng)險(xiǎn)、欺詐以及金融產(chǎn)品的營銷這些依靠過往經(jīng)驗(yàn)難以準(zhǔn)確定量的事件。
深度學(xué)習(xí)在金融領(lǐng)域本質(zhì)上還是進(jìn)行特征提取和問題描述,因?yàn)樵谡麄€(gè)金融鏈條上,包括借貸、個(gè)人理財(cái)、等多種金融產(chǎn)品和服務(wù)上,數(shù)據(jù)都起著核心作用,尤其是銀行,擁有著上億規(guī)模的標(biāo)注數(shù)據(jù)。“機(jī)器的深度學(xué)習(xí)可以將這些數(shù)據(jù)通過特征表達(dá)的方式轉(zhuǎn)化到復(fù)雜的數(shù)據(jù)模型上,并依靠深層的神經(jīng)網(wǎng)絡(luò),生成多層非線性的表達(dá),這種表達(dá)可以代替原先的簡(jiǎn)單描述,”雷濤稱。“例如Alpha go,就是利用深層的神經(jīng)網(wǎng)絡(luò)解決了對(duì)棋手棋風(fēng)的描述和棋手大局觀的定義問題,從而使之戰(zhàn)勝世界級(jí)冠軍。”
事實(shí)上,國內(nèi)目前將人工智能的深度學(xué)習(xí)技術(shù)與銀行反欺詐相結(jié)合的應(yīng)用還比較少,一些征信類公司開始通過提供豐富的外部數(shù)據(jù)資源來為銀行提供反欺詐技術(shù)支持。例如前海征信研發(fā)部門基于Encoder-Decoder深度學(xué)習(xí)技術(shù)框架設(shè)計(jì)的智能風(fēng)控專家機(jī)器人,可以應(yīng)用于銀行業(yè)風(fēng)控反欺詐領(lǐng)域,解釋貸款產(chǎn)品特性、借款人風(fēng)險(xiǎn)識(shí)別、貸款產(chǎn)品政策等各類問題,高效智能地服務(wù)信貸審批、貸后風(fēng)控管理和資產(chǎn)組合經(jīng)理,提升信貸產(chǎn)品審批速度,降低客戶違約率,防范貸款欺詐風(fēng)險(xiǎn)。
同時(shí),一些金融科技企業(yè)也正在與銀行合作。例如天云大數(shù)據(jù)近期就利用其模型算法訓(xùn)練平臺(tái)(MaximAI)為光大銀行提供反欺詐方面的技術(shù)支持。基于樣本數(shù)據(jù)進(jìn)行一站式的模型算法訓(xùn)練、驗(yàn)證以及輸出。訓(xùn)練完成的模型算法程序,被輸出到欺詐分析引擎中,運(yùn)行于大數(shù)據(jù)平臺(tái)技術(shù)上,實(shí)現(xiàn)了實(shí)時(shí)在線對(duì)交易數(shù)據(jù)進(jìn)行欺詐識(shí)別。
然而,目前在銀行反欺詐方面中國與北美的差距還是很大的,硅谷的金融科技創(chuàng)業(yè)公司很早就將這一技術(shù)應(yīng)用到金融反欺詐中。例如,京東和百度同時(shí)投資的美國金融科技公司Zest Finance,便是利用機(jī)器的深度學(xué)習(xí)這一人工智能中最重要的技術(shù)手段,從大量的數(shù)據(jù)中提取變量并采用多個(gè)預(yù)測(cè)分析模型包括欺詐模型、預(yù)付能力模型來幫助用戶降低信貸成本,其核心競(jìng)爭(zhēng)力便是數(shù)據(jù)挖掘能力和模型開發(fā)能力。
機(jī)器深度學(xué)習(xí)提升反欺詐能力
利用機(jī)器的深度學(xué)習(xí)技術(shù)反欺詐的原理,實(shí)際上是從銀行反欺詐的脆弱點(diǎn)著手,不再只通過傳統(tǒng)策略引擎,而是通過機(jī)器收集到大量異構(gòu)、多源化的信息,包括可交叉驗(yàn)證信息主體所提供的信息以及第三方信息來源的真實(shí)性,形成共享庫。通過對(duì)數(shù)據(jù)的采集和分析,再通過機(jī)器學(xué)習(xí)及復(fù)雜網(wǎng)絡(luò)等模型算法技術(shù),對(duì)數(shù)據(jù)進(jìn)行深度挖掘,從傳統(tǒng)歷史數(shù)據(jù)中量化抽取風(fēng)險(xiǎn)特征指標(biāo),利用復(fù)雜網(wǎng)絡(luò)關(guān)聯(lián)分析技術(shù)從歷史違約數(shù)據(jù)中發(fā)現(xiàn)實(shí)時(shí)欺詐業(yè)務(wù)風(fēng)險(xiǎn)指標(biāo),豐富深度學(xué)習(xí)風(fēng)險(xiǎn)模型的業(yè)務(wù)維度,建立人工智能反欺詐模型,從而發(fā)現(xiàn)欺詐者隱藏的蛛絲馬跡,分析其數(shù)據(jù)的矛盾點(diǎn)和可疑點(diǎn),從而識(shí)別欺詐者身份,加上與傳統(tǒng)經(jīng)驗(yàn)規(guī)則配合使用,大幅提升銀行欺詐風(fēng)險(xiǎn)的防控能力。
欺詐分析所使用的數(shù)據(jù)主要來源內(nèi)部數(shù)據(jù)和外部數(shù)據(jù),針對(duì)不同的數(shù)據(jù)源,通過多種采集方式對(duì)數(shù)據(jù)進(jìn)行有效采集,并集中在數(shù)據(jù)湖中進(jìn)行融合存儲(chǔ)。根據(jù)預(yù)測(cè)模型分析的需求,通過配套的數(shù)據(jù)處理技術(shù)工具對(duì)數(shù)據(jù)進(jìn)行預(yù)處理,最終輸出模型訓(xùn)練所需的樣本數(shù)據(jù)。
就拿上述某村莊信用卡申請(qǐng)欺詐為例,銀行可以利用復(fù)雜網(wǎng)絡(luò)(Complex Network)技術(shù),在不從外部引入新數(shù)據(jù)的情況下,抽取現(xiàn)有進(jìn)件數(shù)據(jù)(application form)的關(guān)聯(lián)性,從每一個(gè)進(jìn)件與進(jìn)件的關(guān)聯(lián)中分辨出是否使用類似的電話號(hào)碼、類似的地址以及類似的區(qū)域,建立的社交關(guān)聯(lián)屬性與其他金融數(shù)據(jù)輸入深度學(xué)習(xí)網(wǎng)絡(luò)做有監(jiān)督的訓(xùn)練,在數(shù)十萬欺詐案例數(shù)據(jù)上得到一個(gè)動(dòng)態(tài)識(shí)別模型。
去年10月,美國政府發(fā)布的《為人工智能的未來做好準(zhǔn)備(Preparing for the Future of Atificial Intelligence)》報(bào)告稱,機(jī)器的深度學(xué)習(xí)是人工智能最重要的技術(shù)手段之一,同時(shí)也是人工智能取得很多進(jìn)展和商業(yè)應(yīng)用的基礎(chǔ)。該報(bào)告同時(shí)還提到,現(xiàn)代機(jī)器學(xué)習(xí)是一個(gè)始于大數(shù)據(jù)的統(tǒng)計(jì)學(xué)過程,通過數(shù)據(jù)分析推導(dǎo)出規(guī)則或者流程,用于解釋數(shù)據(jù)或者預(yù)測(cè)未來數(shù)據(jù)。
在金融科技領(lǐng)域,大型金融實(shí)體與Fintech企業(yè)的合作上具有獨(dú)到優(yōu)勢(shì),因其多年歷史沉淀下來的數(shù)據(jù),不僅僅是行為數(shù)據(jù),更有有價(jià)值的違約數(shù)據(jù),與人工智能目前的發(fā)展階段非常匹配——即提供給機(jī)器“答案”的學(xué)習(xí)。
未來,隨著人工智能的逐步成熟,例如當(dāng)下GAN對(duì)抗神經(jīng)網(wǎng)絡(luò)等科技演進(jìn),讓機(jī)器自主選擇方法,我們不僅不再需要描述問題,或?yàn)樘峁┐鸢付袚?dān)昂貴的試錯(cuò)成本,而是面向最終安全的反欺詐目標(biāo),由人工智能提供面向“目標(biāo)”的學(xué)習(xí)。