作為創(chuàng)新型金融科技公司,度小滿旗下?lián)碛斜姸喈a(chǎn)品和服務(wù);其中,在人工智能領(lǐng)域中,度小滿不斷加大在計(jì)算機(jī)視覺和自然語(yǔ)言處理等方面的研究力度,得到了行業(yè)的一致認(rèn)可。
此前,度小滿數(shù)據(jù)智能應(yīng)用部AI-Lab的兩篇論文分別入選ACM MM和CIKM國(guó)際頂級(jí)會(huì)議。兩篇論文分別就多模態(tài)和預(yù)訓(xùn)練排序等多個(gè)熱門話題提出了新穎的算法,并在相關(guān)任務(wù)上達(dá)到了國(guó)際頂尖水平,獲得了審稿人的一致好評(píng)并最終錄用。這標(biāo)志著度小滿在自然語(yǔ)言處理和計(jì)算機(jī)視覺等人工智能前沿領(lǐng)域的研究得到了國(guó)際同行的認(rèn)可。
論文簡(jiǎn)介:
許多圖像除了實(shí)際的物體和背景等信息外,通常還包含著很有價(jià)值的文本信息,這對(duì)于理解圖像場(chǎng)景是十分重要的。因此本文主要研究基于文本的視覺問(wèn)答任務(wù),這項(xiàng)任務(wù)要求機(jī)器可以理解圖像場(chǎng)景并閱讀圖像中的文本來(lái)回答相應(yīng)的問(wèn)題。然而之前的大多數(shù)工作往往需要設(shè)計(jì)復(fù)雜的圖結(jié)構(gòu)和利用人工指定的特征來(lái)構(gòu)建圖像中視覺實(shí)體和文本之間的位置關(guān)系。為了直觀有效地解決這些問(wèn)題,我們提出了具有實(shí)體對(duì)齊網(wǎng)格的位置增強(qiáng)Transformer。與之前的模型相比,我們?cè)诓恍枰獜?fù)雜規(guī)則的情況下,顯式地引入了目標(biāo)檢測(cè)和OCR識(shí)別的視覺實(shí)體的連續(xù)相對(duì)位置信息。同時(shí)我們根據(jù)物體與OCR實(shí)體映射關(guān)系,用直觀的實(shí)體對(duì)齊網(wǎng)格代替復(fù)雜的圖形結(jié)構(gòu)。在該網(wǎng)格中,不同位置的離散實(shí)體和圖像的區(qū)塊信息可以充分交互。
該模型能夠整合目標(biāo)檢測(cè)、OCR以及基于Transformer的文本表示等多種方法的優(yōu)勢(shì),增強(qiáng)算法對(duì)于圖像中場(chǎng)景信息的理解,更精準(zhǔn)的融合圖像與文本多模態(tài)的信息,進(jìn)一步助力證件識(shí)別、人臉與活體檢測(cè)等業(yè)務(wù)場(chǎng)景,提升度小滿在視覺風(fēng)控方面的技術(shù)能力。
基于BERT的動(dòng)態(tài)多粒度排序模型被CIKM錄用
Dynamic Multi-Granularity Learning for BERT-based document Reranking
會(huì)議介紹:CIKM(The Conference on Information and Knowledge Management ) 是由ACM主辦的信息檢索和數(shù)據(jù)挖掘等領(lǐng)域的國(guó)際頂級(jí)會(huì)議,由國(guó)際計(jì)算機(jī)學(xué)會(huì)ACM SIGIR分會(huì)主辦,每年召開一次。自1992年以來(lái),CIKM成功匯聚了一批相關(guān)領(lǐng)域的優(yōu)秀研究人員,交流信息與知識(shí)管理研究、數(shù)據(jù)和知識(shí)庫(kù)等方面的最新發(fā)展,在相關(guān)領(lǐng)域享有非常高的學(xué)術(shù)聲譽(yù)。今年的CIKM將于11月1日- 5日在澳大利亞昆士蘭舉辦。
論文簡(jiǎn)介:
近年來(lái),預(yù)訓(xùn)練的語(yǔ)言模型廣泛應(yīng)用于文本的檢索排序任務(wù)中。然而,在真實(shí)場(chǎng)景中,用戶的行為往往受到選擇或曝光偏差的影響,這可能會(huì)導(dǎo)致錯(cuò)誤的標(biāo)簽進(jìn)而引入額外噪聲。而對(duì)于不同候選文檔,以往的訓(xùn)練優(yōu)化目標(biāo)通常使用單一粒度和靜態(tài)權(quán)重。這使得排序模型的性能更容易受到上述問(wèn)題的影響。因此,在本文中我們重點(diǎn)研究了基于BERT的文檔重排序任務(wù),開創(chuàng)性地提出了動(dòng)態(tài)多粒度學(xué)習(xí)方法。該種方法能夠讓不同文檔的權(quán)重根據(jù)預(yù)測(cè)概率動(dòng)態(tài)變化,從而減弱不正確的文檔標(biāo)簽帶來(lái)的負(fù)面影響。此外,該方法還同時(shí)考慮了文檔粒度和實(shí)例粒度來(lái)平衡候選文檔的相對(duì)關(guān)系和絕對(duì)分?jǐn)?shù)。在相關(guān)基準(zhǔn)數(shù)據(jù)集上的實(shí)驗(yàn)進(jìn)一步驗(yàn)證了我們模型的有效性。
該模型有效地提升了長(zhǎng)文本理解與排序任務(wù)的性能,特別是其中所用到的預(yù)訓(xùn)練語(yǔ)言模型已經(jīng)成為度小滿在自然語(yǔ)言處理方面的基礎(chǔ)架構(gòu),在獲客、信貸等業(yè)務(wù)場(chǎng)景被廣泛地使用,為業(yè)務(wù)模型提供了更加豐富的文本表示和精準(zhǔn)的文本特征,在保障業(yè)務(wù)穩(wěn)健發(fā)展中起到了十分重要的作用。
人工智能在金融服務(wù)領(lǐng)域中的應(yīng)用廣泛,覆蓋提升安全性、提高工作效率、加強(qiáng)算法交易、完善信貸服務(wù)、優(yōu)化投資組合管理等多個(gè)層面。作為創(chuàng)新型金融科技公司,度小滿充分發(fā)揮創(chuàng)新技術(shù)實(shí)力,積累了大量豐富的經(jīng)驗(yàn),同時(shí)也不斷將創(chuàng)新技術(shù)與服務(wù)相結(jié)合,更好地助力金融服務(wù)行業(yè)發(fā)展。