在加拿大溫哥華昨日舉行的全球最大計(jì)算機(jī)視覺(jué)會(huì)議CVPR 2023上,LG人工智能研究所公開(kāi)了該公司首個(gè)生成式AI商業(yè)化服務(wù)Captioning AI,為需要管理大量圖片的客戶提供了更高效的解決方案。

▲圖源:LG

▲圖源:LG
LG介紹,Captioning AI基于零次學(xué)習(xí)技術(shù),使AI可以像人類一樣利用其先前積累的經(jīng)驗(yàn)和知識(shí)來(lái)解釋它第一次看到的物體或場(chǎng)景。平均而言,該服務(wù)能在10秒內(nèi)為一張圖片生成5個(gè)完整的描述性句子和10個(gè)關(guān)鍵詞。如果將圖片數(shù)量擴(kuò)大到1萬(wàn)張,這些工作將在兩天內(nèi)完成,從而在短時(shí)間內(nèi)建立定制化的圖片搜索和管理系統(tǒng)。
LG表示,Captioning AI是LG人工智能研究所與全球最大的圖庫(kù)之一Shutterstock深度合作研發(fā),后者在圖像標(biāo)簽方面擁有豐富的專業(yè)知識(shí)。此外,雙方還進(jìn)行了學(xué)習(xí)數(shù)據(jù)的過(guò)濾和篩選等AI倫理驗(yàn)證,以確保版權(quán)透明度。
Shutterstock首席技術(shù)官Sezal Amin表示:“目前,我們正在通過(guò)為全球10家客戶開(kāi)展早期訪問(wèn)(Early Access)計(jì)劃來(lái)進(jìn)一步開(kāi)發(fā)這種服務(wù)。這項(xiàng)服務(wù)意在幫助人們關(guān)注更重要的內(nèi)容和具有創(chuàng)造性的任務(wù),而不是重復(fù)性的機(jī)械任務(wù)。”
IT之家此前報(bào)道,韓國(guó)政府為進(jìn)一步加強(qiáng)新興技術(shù)領(lǐng)域發(fā)展,本月初已決定加大對(duì)人工智能技術(shù)研發(fā)的投入,投資約5000億韓元(IT之家備注:當(dāng)前約26.9億元人民幣)推進(jìn)韓國(guó)AI項(xiàng)目發(fā)展。