作為人類在元宇宙中的主要生命形式,數(shù)字人已經(jīng)成為達(dá)成元宇宙應(yīng)用場景落地的關(guān)鍵命題。
Research and Markets研究顯示,全球虛擬活動(dòng)市場規(guī)模將超過3.2萬億人民幣,同時(shí)IDC最新發(fā)布的報(bào)告也顯示,中國虛擬數(shù)字人市場規(guī)模也呈現(xiàn)出高速增長的趨勢,預(yù)計(jì)到2026年規(guī)模將達(dá)102.4億元。
今年,AI算法公司「大觥科技」抓住虛擬數(shù)字人的風(fēng)口,開展虛擬數(shù)字人業(yè)務(wù),以實(shí)現(xiàn)數(shù)字人的快速生成、快速驅(qū)動(dòng)和多樣化交付。在此之前,成立于2018年的大觥科技從影像處理AI算法發(fā)軔——針對B端客戶,大觥科技為專業(yè)影視機(jī)構(gòu)提供專業(yè)級(jí)影像修復(fù)及增強(qiáng)服務(wù)。針對C端客戶,大觥科技通過“Silimini”和“你我當(dāng)年”等移動(dòng)端App提供專業(yè)級(jí)的圖像及影像修復(fù)、增強(qiáng)服務(wù)。
在這一過程中,大觥科技逐步深化AI技術(shù)優(yōu)勢,打磨出一套針對手機(jī)用戶的高效3D建模算法。為了解決傳統(tǒng)手工建模和相機(jī)陣列等技術(shù)生成周期長、費(fèi)用高、環(huán)境限制大等痛點(diǎn),大觥科技的數(shù)字人生成方案采用手機(jī)攝像頭動(dòng)態(tài)采樣技術(shù),通過算法生成3D超寫實(shí)數(shù)字人。
大觥科技將生成數(shù)字人的時(shí)間由傳統(tǒng)方式的幾周到幾個(gè)月壓縮至1分鐘以下。此外,相較于手工建模和相機(jī)陣列等技術(shù),大觥科技提供的技術(shù)方案優(yōu)勢在于生成速度快、通用性強(qiáng)、還原程度高,由于使用了工業(yè)級(jí)的布線、綁定及文件標(biāo)準(zhǔn),使得大觥生成的數(shù)字人可在多個(gè)場景和平臺(tái)快速使用及導(dǎo)出。
借助自主開發(fā)的元宇宙社交與娛樂App metata,大觥科技對快速生成虛擬數(shù)字人的應(yīng)用場景進(jìn)行了實(shí)驗(yàn)。用戶只需用手機(jī)前置攝像頭錄制一段視頻,就能高效生成與自己還原度高度一致的超寫實(shí)數(shù)字人。
同時(shí),大觥科技還提供了基于手機(jī)及攝像頭的數(shù)字人快速驅(qū)動(dòng)方案,該方案對設(shè)備和環(huán)境的要求較低,支持手機(jī)實(shí)時(shí)或離線驅(qū)動(dòng)。此外,大觥科技數(shù)字人生成的API在同類企業(yè)中具有價(jià)格優(yōu)勢,采取根據(jù)調(diào)用量階梯定價(jià)的策略,價(jià)格位于百元檔。
目前,大觥科技的業(yè)務(wù)發(fā)力點(diǎn)在B端。通過建立全套數(shù)字人交付技術(shù)棧,大觥科技的交付技術(shù)棧集成了3D引擎重建、面部表情及肢體動(dòng)作驅(qū)動(dòng)、TTS/NLP能力集成、人機(jī)交互引擎、環(huán)境場景生成等服務(wù)場景,并根據(jù)服務(wù)的不同采用獨(dú)立應(yīng)用、API服務(wù)、游戲服務(wù)、在線平臺(tái)、大客戶定制等交付形式。
今年10月中旬,大觥科技計(jì)劃對外推出生成3D寫實(shí)數(shù)字人的技術(shù)Demo。在未來,借助自研的一鍵式AI能力調(diào)用服務(wù)平臺(tái)“大觥AI開放平臺(tái)”,大觥科技計(jì)劃在數(shù)字人生成的風(fēng)格多樣性上發(fā)力,并通過加入虛擬服裝等數(shù)字資產(chǎn),為用戶提供更多的應(yīng)用場景。
大觥科技CEO黃碩曾在螞蟻金服任人工智能部高級(jí)總監(jiān)、資深產(chǎn)品專家等要職。CTO兼首席科學(xué)家李昊在計(jì)算機(jī)視覺、人工智能深度學(xué)習(xí)、計(jì)算機(jī)圖形學(xué)等技術(shù)領(lǐng)域有多年經(jīng)驗(yàn)。目前公司有約50名員工,近70%的人員負(fù)責(zé)算法和研發(fā)。