阿里旗下達(dá)摩院日前與大連理工大學(xué)合作,推出了一款名為HQTrack的AI框架。該框架主要由視頻多目標(biāo)分割器(VMOS)和掩模優(yōu)化器(MR)組成,旨在“實(shí)現(xiàn)對視頻中任何目標(biāo)的高質(zhì)量跟蹤”。

▲圖源HQTrack的GitHub頁面
研究團(tuán)隊(duì)表示,HQTrack基于開源框架DeAOT、HQ-SAM,在此之上進(jìn)行了一定改進(jìn),實(shí)現(xiàn)了“在視頻中分割各目標(biāo)”的可能性。

▲圖源HQTrack的GitHub頁面
同時(shí),研究團(tuán)隊(duì)使用Intern-T作為特征提取器,提高框架對不同類型物體的區(qū)分能力,同時(shí)加入了一個(gè)門控傳播模塊(GPM),以便于框架在復(fù)雜環(huán)境中感知更多微小物體,生成高質(zhì)量的即時(shí)目標(biāo)遮罩。
據(jù)悉,在VOTS2023競賽中,HQTrack以0.615的質(zhì)量得分獲得第二名,研究團(tuán)隊(duì)表示,該AI框架可以應(yīng)用于人臉識別、智能駕駛、監(jiān)控追蹤等領(lǐng)域,并有望在未來商業(yè)應(yīng)用中落地。
該項(xiàng)目目前已經(jīng)在GitHub中開放,感興趣的小伙伴們可以在此訪問,IT之家將HQTrack核心功能轉(zhuǎn)錄于下方:
1.多目標(biāo)追蹤:HQTrack可以同時(shí)追蹤多個(gè)目標(biāo)對象,適用于復(fù)雜場景下的目標(biāo)追蹤任務(wù)。
2.目標(biāo)分割:HQTrack能夠準(zhǔn)確地分割視頻中的目標(biāo)對象,并生成高質(zhì)量的目標(biāo)遮罩,可用于目標(biāo)識別和分析。
3.高質(zhì)量輸出:HQTrack的追蹤結(jié)果具有高質(zhì)量和高準(zhǔn)確性,能夠滿足各種應(yīng)用場景的需求。
4.簡單易用:HQTrack提供了簡潔的接口和使用指南,用戶可以輕松地使用和集成該工具。