今年夏天烈日炎炎,在太陽的直射之下,不僅是人類很難睜開眼睛,張目對日,即便是專業(yè)相機、手機等攝影設(shè)備在拍攝太陽的過程中,也很容易因過強的陽光而對攝像頭中的元器件造成傷害。雖然景色在拍攝成視頻之后,所有人都可以從屏幕中看到炫目的光點,但這本質(zhì)上是因為當(dāng)前的視頻都以SDR(標(biāo)準(zhǔn)動態(tài)范圍)規(guī)格拍攝和顯示,無法呈現(xiàn)出真實世界的亮度。
目前雖然市面上HDR(高動態(tài)范圍)顯示設(shè)備越來越多,但能直接拍攝、錄制HDR視頻的設(shè)備卻依然有限,這就造成了大多數(shù)可獲得的視頻資源仍然是SDR格式,隨著AI技術(shù)在計算攝影領(lǐng)域的應(yīng)用,SDR高保真的轉(zhuǎn)為HDR成為可能,AI能在理解場景信息的基礎(chǔ)上,重現(xiàn)蠟燭、燈光、太陽真實的色調(diào)和高光,無需高昂的HDR錄制設(shè)備,手機也能實現(xiàn)HDR視頻的拍攝。

圖源:曠視
將SDR轉(zhuǎn)換為HDR規(guī)格的視頻,只是AI為手機計算攝影帶來的技術(shù)革新中的冰山一角,AI甚至在硬件形態(tài)上重新定義了手機計算攝影。如今的手機不需要像單反相機那么大的鏡頭和光圈就能實現(xiàn)虛化、變焦、雙重曝光、視頻光斑,甚至手機就能實現(xiàn)專業(yè)攝像機才具備的電影模式。
AI算法的介入呈現(xiàn)在手機形態(tài)上的改變就是攝像頭、傳感器的增多,以及更小、更輕薄、更多樣化的傳感器,傳感器將不再單獨的、直接的提供應(yīng)用的價值,手機和傳感器之間需要算法來作為承上啟下的橋梁,可以說AI正在定義手機傳感器。
縱觀歷史,AI與硬件的關(guān)系其實同軟件和硬件關(guān)系的演進歷程非常相似。著名的網(wǎng)景公司創(chuàng)始人MarcAndreessen曾說,軟件正在吞噬人類世界(Softwareeatstheworld)。
那么,在AI加速發(fā)展的今天,算法定義硬件逐漸在成為現(xiàn)實。
軟件定義時代
在軟件剛出現(xiàn)不久的軟硬一體化階段,軟件更多作為一種高級程序設(shè)計語言而存在,用戶對其感知并不強,一直到IBM360系列機硬件搭配OS/360操作系統(tǒng)捆綁出售,人們才逐漸意識到軟件系統(tǒng)的重要性,但此時的軟件系統(tǒng)依然被視為硬件的附屬品,其應(yīng)用領(lǐng)域和靈活性都比較差。
微軟及Windows操作系統(tǒng)的誕生則標(biāo)志著軟件行業(yè)發(fā)生了翻天覆地的變化,軟件不再作為硬件的附屬品而捆綁銷售,而是作為獨立可遷移“拷貝”售賣的版權(quán)商品,顛覆了過去計算機行業(yè)硬件為王的時代,各類辦公、影音、游戲軟件重塑了人們的經(jīng)濟生活,微軟也憑借在軟件系統(tǒng)上的強勢,成為了IT行業(yè)的頭部企業(yè),這個階段屬于軟件的產(chǎn)品化、產(chǎn)業(yè)化階段。
在互聯(lián)網(wǎng)普及和其商業(yè)化帶來的信息化浪潮2.0階段,軟件也開始與互聯(lián)網(wǎng)深度融合,“軟件即服務(wù)”(SoftwareasaService)的概念開始被提出,即用戶不再需要通過單機拷貝的方式來獲得軟件服務(wù),通過互聯(lián)網(wǎng)即能隨時隨地按需使用軟件的功能。在軟件的網(wǎng)絡(luò)化和服務(wù)化階段,以蘋果AppleStore為代表的各類移動應(yīng)用商店迅猛發(fā)展,百萬開發(fā)者和海量移動端應(yīng)用出現(xiàn),微信、淘寶、美團、微博等超級應(yīng)用也是在這一時期出現(xiàn),在軟件的定義下,手機從最初的通訊硬件工具變成了平臺式的智能手機。
如今,軟件定義已成為行業(yè)共識,如果說,互聯(lián)網(wǎng)的核心價值是“連接”,那么,軟件就是實現(xiàn)“連接”的基礎(chǔ)技術(shù)。雖然軟件在PC、智能手機領(lǐng)域已滲入的足夠深,但在如今的物聯(lián)網(wǎng)時代,千行百業(yè)中各類復(fù)雜多變的loT硬件卻和軟件連接的卻仍然不夠。
如今,AI算法在人類社會經(jīng)濟生活中扮演的角色愈加重要,從當(dāng)下最熱門的互聯(lián)網(wǎng)軟件抖音、臉書、淘寶、亞馬遜背后都有AI算法的身影,智能電視、掃地機器人、智能空調(diào)、智能空氣凈化器等越來越多的硬件也在與AI深度融合。
而AI算法正是軟件定義時代突破IoT領(lǐng)域的關(guān)鍵技術(shù),在新一輪的軟件定義浪潮中扮演“連接者”的角色。
AI突破IoT閉環(huán)
在手機AppleStore中,用戶想要購物、外賣、游戲、影音,每種類別下都有無數(shù)應(yīng)用可以選擇,但在家庭里的吸塵器、電視、冰箱、空調(diào)、油煙機等各類IoT設(shè)備中,卻常??床坏娇蛇x擇應(yīng)用的軟件選項,傳統(tǒng)的軟硬件方式難以滿足AIoT海量場景的智能化需求。
據(jù)2021年艾瑞咨詢統(tǒng)計的數(shù)據(jù),當(dāng)前的AIoT行業(yè),AI的滲透率僅為4%,還有約96%的場景還沒有被AI滲透。過去,AIoT端傳統(tǒng)的智能化解決方案是根據(jù)硬件“灌”算法,即根據(jù)不同型號、不同種類的硬件來為其適配一套算法,這種解決方案是以硬件為主導(dǎo)的,硬件、場景和AI算法之間的聯(lián)系較為割裂,硬件的設(shè)計沒有考慮AI算法數(shù)據(jù)采集和硬件適配的需求,這導(dǎo)致算法的復(fù)用度低,算法必須在硬件功能與場景之間尋找平衡,性能上做出妥協(xié),硬件的性能與真實需求之間存在鴻溝。
硬件和AI算法的割裂就無法解決嗎?起碼在計算攝影領(lǐng)域曠視已突破了這種割裂,在前文的例子中,智能手機憑借AI算法讓其機身上小巧、輕薄的攝像頭達(dá)到能媲美一些專業(yè)相機的拍攝效果,在AI算法的定義下,手機攝像頭的形態(tài)相對于專業(yè)相機也做出了調(diào)整,AI算法需要多個不同功能的攝像頭來計算景深、解析色彩。
根據(jù)不同場景,AI會在一開始便判斷需要調(diào)動的不同鏡頭組合,來實現(xiàn)用戶想要的拍攝效果。例如,當(dāng)用戶選擇風(fēng)光模式時,AI算法便已將主攝像頭和廣角攝像頭調(diào)動起來;當(dāng)用戶選擇人像模式時,AI算法便會調(diào)動主攝像頭和人物細(xì)節(jié)解析力更好的黑白攝像頭結(jié)合起來,在雙攝像頭模擬大光圈效果的同時獲得更優(yōu)的人像表現(xiàn)能力。
如果將場景放到更加復(fù)雜、零碎的AIoT領(lǐng)域,千千萬萬的設(shè)備如何連接起來呢?曠視的解法是“算法定義硬件”,即通過如AppleStore中應(yīng)用數(shù)量般的海量算法+各領(lǐng)域的通用型/標(biāo)準(zhǔn)硬件,來滿足AIoT領(lǐng)域海量的碎片化場景需求。
簡單來說就是從“海量硬件+定制算法”轉(zhuǎn)變?yōu)?ldquo;海量算法+通用硬件”。
在今年的曠視企業(yè)業(yè)務(wù)合作伙伴大會上,曠視聯(lián)合創(chuàng)始人、企業(yè)業(yè)務(wù)事業(yè)部研發(fā)負(fù)責(zé)人楊沐表示:“一方面是產(chǎn)品和應(yīng)用場景足夠豐富、算法功能需求日新月異,針對每一個場景都進行硬件和算法的定制適配效率太低。另一方面,AI時代的基礎(chǔ)產(chǎn)品不再是一個個孤立的硬件載體,也不是一個硬件搭配軟件這么簡單,需要有一整套的具備擴展性和低成本的軟硬件體系。”
曠視將算法前置,以“算法定義硬件”,其實就是用可隨時迭代更新升級的海量算法,來匹配復(fù)雜多變、碎片化的AIoT場景,通用標(biāo)準(zhǔn)化的硬件則作為算法的載體,相比于更新迭代成本較大的硬件,更貼近用戶場景需求的AI算法無疑更適合作為核心,來定義一套AIoT產(chǎn)品,由此,用戶無需頻繁更換硬件,就能通過算法定義功能,來滿足日新月異的場景和需求。

圖源:曠視
算法定義硬件
當(dāng)然,要成功實現(xiàn)“算法定義硬件”并不容易,首先出現(xiàn)的難題就是海量算法的生產(chǎn)上,AI的背后就是算法,海量的算法是實現(xiàn)“算法定義硬件”的前提,只有算法生產(chǎn)想當(dāng)下的海量APP一般,生產(chǎn)的足夠多、足夠快、成本足夠低,海量算法來定義硬件才會成為可能。
曠視認(rèn)為算法生產(chǎn)的主要困難集中在整個生產(chǎn)環(huán)節(jié)的復(fù)雜性上。具體來說,可以分為三個方面:第一,數(shù)據(jù)生產(chǎn)的復(fù)雜性。第二,算法模型本身的不確定性。第三,算法最終要推廣落地到各式各樣的AIoT平臺上,這個硬件平臺的多樣性也帶來了整個生產(chǎn)過程的復(fù)雜和高成本。
曠視則具備算法量產(chǎn)的能力,曠視本身是一個算法起家的公司,基于Brain++,曠視有固定流水線式的批量生產(chǎn)算法,能以更低成本生產(chǎn)更高質(zhì)量的算法,并且這些算法能夠隨著AI落地的推廣程度,根據(jù)數(shù)據(jù)迭代不斷進化。
算法生產(chǎn)過程標(biāo)準(zhǔn)化正是真效地解決復(fù)雜的、碎片化的算法生產(chǎn)所面臨挑戰(zhàn)的手段。這個標(biāo)準(zhǔn)化包括了數(shù)據(jù)生產(chǎn)的標(biāo)準(zhǔn)化、算法模型的標(biāo)準(zhǔn)化和整個推理框架的標(biāo)準(zhǔn)化。曠視自研的算法生產(chǎn)平臺AIS是基于曠視Brain++體系,在曠視自研的深度學(xué)習(xí)框架MegEngine中,曠視搭建了數(shù)據(jù)管理平臺MegData和計算平臺MegCompute,它們?yōu)樗惴ㄉa(chǎn)構(gòu)建的一個從數(shù)據(jù)處理到模型訓(xùn)練,到性能分析調(diào)優(yōu),到推理部署測試全鏈路的零代碼自動化的生產(chǎn)力工具平臺。
算法量產(chǎn)是對AI生產(chǎn)模式的理念革新和生產(chǎn)力進化,曠視構(gòu)建了“2+1”的AIoT核心技術(shù)科研體系,即以“基礎(chǔ)算法科研”和“規(guī)模算法量產(chǎn)”為兩大核心的AI技術(shù)體系,和以“計算攝影學(xué)”為核心的“算法定義硬件”IoT技術(shù)體系(包括AI傳感器和AI機器人)。
“算法定義硬件”,除了已經(jīng)在智能手機行業(yè)中廣為應(yīng)用的AI+計算攝影,曠視的“魔方盒子”也是近年來成功的產(chǎn)品落地案例。“魔方盒子”是曠視研發(fā)的邊緣計算產(chǎn)品,它能以一種更加經(jīng)濟和智能的方式,讓前端大量非智能的高清攝像機具備AI識別能力。
傳統(tǒng)的智能攝像頭難以同時進行“圖像檢測”、“煙霧檢測”、“工地未佩戴安全帽檢測”、“危險行為檢測”等諸多不同類型檢測任務(wù),常常需要根據(jù)園區(qū)、工地、加油站、停車棚等不同的應(yīng)用場景更換不同的攝像設(shè)備,而曠視的“魔方盒子”則是基于“算法定義硬件”的理念所設(shè)計,在設(shè)計之初就和芯片硬件進行聯(lián)合調(diào)優(yōu),只需通過更新迭代盒子中的算法,不需要更新攝像頭硬件就能實現(xiàn)一套設(shè)備匹配安監(jiān)領(lǐng)域、辦公領(lǐng)域、社區(qū)領(lǐng)域、智慧工地等等不同場景。

圖源:曠視;“魔方盒子”
目前,曠視已經(jīng)形成了最小硬件閉環(huán)體系,不過“算法定義硬件”仍是一個宏偉的目標(biāo),還有很長的路要走,曠視為其規(guī)劃了三個發(fā)展階段。第一個階段也是目前所處的階段,以自研硬件為基礎(chǔ)開啟產(chǎn)品階段。第二個階段,是通過算法下發(fā)平臺實現(xiàn)用戶的個性化采購。第三個階段則是生態(tài)的充分開放,充足的算法供應(yīng)與不同廠商的硬件,形成開放的行業(yè)生態(tài)。
AIoT是一場持久戰(zhàn),未來,曠視將持續(xù)推動AI核心技術(shù)能力的突破,讓算法的生產(chǎn)和部署更快、更好、更便宜。另一方面,不斷積累豐富的硬件know-how以及算法的軟硬件協(xié)同設(shè)計能力,實現(xiàn)更多完整的產(chǎn)品價值閉環(huán),讓海量算法和硬件形成開放的生態(tài),重鑄AIoT行業(yè)。