一、大數(shù)據(jù)+ AI的優(yōu)勢
1、更準確的評估用戶信用
解釋:能夠考慮過去可能沒有得到信用評分的人,或者可能被傳統(tǒng)的基于邏輯回歸的評分太匆忙地拒絕了。換句話說,AI可以查看消費者信用記錄中的某些數(shù)據(jù)點,計算他們即將償還的概率;或者考慮那些過去12個月都沒有還款(基于某些原因),但是在某一個數(shù)據(jù)點,他們償還了所有的款項的人群。
2、AI對風控的控制更加精確
解釋:人為的去做風控,每一個人都會有自己的主觀看法和偏差,但是用AI + 模型 + 大數(shù)據(jù)去判斷風險,去控制風險,可以令風險的控制和判斷更加精準。
3、極大提升傳統(tǒng)征信行業(yè)的決策效率
解釋:AI對大數(shù)據(jù)量的加工處理更高效,決策效率也很高,替代了大部分的人工操作和決策過程。
二、AI(以DL為例) 和 ML(以LR為例)在征信大數(shù)據(jù)上的區(qū)別與聯(lián)系
區(qū)別:
1、DL對數(shù)據(jù)的學習更加全面深刻,而LR過于教條;
解釋:DL可以通過復雜的推理,在大數(shù)據(jù)中找到不明顯的東西(優(yōu)勢中的第一點),而往往這些特殊的、或者個別的才最重要;LR則要求我們對數(shù)據(jù)強行結構化,這種做法容易消磨原始數(shù)據(jù)的真實性。
2、DL在訓練時能夠兼顧多個變量之間的交互情況,而LR更多的是考慮單個變量;
3、LR對借款人的可解釋性更強,DL目前難以提供專業(yè)的“原因代碼”(據(jù)說Equifax公司已經(jīng)有了一套生成原因代碼的算法)。
聯(lián)系:
1、ML:任何通過數(shù)據(jù)訓練的學習算法的相關研究;
2、DL:深度學習不僅僅是具備多層架構的感知器,而是一系列能夠用來構建可組合可微分的體系結構的技術和方法;
3、AI是一個很大的概念,而ML則是AI的一個分支——》ML是AI的子集;
4、機器學習包括了ANN(人工神經(jīng)網(wǎng)絡),而ANN是深度學習的起源——》DL是ML的子集;
5、AI == ML + NLP、圖像處理、人臉識別、語音識別、知識圖譜等
ML == DL + LR、貝葉斯、SVM等

圖1 AI、ML、DL的聯(lián)系
三、大數(shù)據(jù)+AI技術如何應用到征信行業(yè)
大數(shù)據(jù) + ML:利用大量用戶金融交易行為記錄類數(shù)據(jù),通過機器學習方法,建立模型,預測用戶信用情況,給出不同形式的反饋結果;
大數(shù)據(jù) + AI:人工智能補充ML的不足,驅動征信業(yè)的發(fā)展;
AI可以通過那些手段、方法,補充ML的不足呢?
DNN:深度訓練、分析用戶信貸類數(shù)據(jù),分析多個變量之間的交互;
NLP:智能問答系統(tǒng)、智能機器人解決信貸者的疑問;
圖象處理:掃描信貸者的證件;
人臉識別:人臉識別活體,和身份證做對比;
知識圖譜:解決反欺詐問題、不一致性驗證、團伙欺詐等;
知識圖譜應用舉例如下:
1)不一致性驗證
解釋:張三、李四不同公司,但是同一個電話,這就是風險點,但是我們的實名認證沒有包括這個信息;

解釋:張三和李四是朋友關系,而且張三和借款人也是朋友關系,那我們可以推理出借款人和李四也是朋友關系,而不是父子關系(紅包關系鏈的問題);

2)組團欺詐
解釋:張三、李四和王五之間沒有直接關系,但通三者之間都共享著某一部分信息,組團欺詐的可能性較高。雖然組團欺詐的形式眾多,但有一點值得肯定的是知識圖譜一定會比其他任何的工具提供更佳便捷的分析手段。

四、監(jiān)管(萬存知局長)和業(yè)界對征信業(yè)的看法
1、信用評分——信用模型所用信息不能包括非信貸類(比如某寶所用的特征維度有:學習及職業(yè)經(jīng)歷、人脈關系(已經(jīng)涉及隱私)等,是不可以的?。┬畔?;
2、應用場景——主要在金融領域,特定的用途需要特定的授權;
3、個人征信——三個原則:第三方征信的獨立性;征信活動中的公正性;個人信息隱私權益保護;
4、個人征信 ≠ 社會信用體系(個人理解:主要是指應用場景的范圍吧,像機場快速通道、談戀愛等,有點夸張了,也是某寶的主意)。
后記展望
人工智能聽起來確實很強大,但是就目前的成果而言,只是提高了人類的工作效率,落實到具體的應用場景,我們還需要更加努力的探索和思考。特別是在金融領域和征信行業(yè),我們更需要投入大量精力,不斷嘗試,不斷創(chuàng)新,積極利用人工智能新技術,新方法,提高工作效率,提升模型精度,提升用戶體驗。