在2月19日召開的2024海淀區(qū)經(jīng)濟(jì)社會高質(zhì)量發(fā)展大會上,中關(guān)村科學(xué)城相關(guān)負(fù)責(zé)人透露,海淀將加快建設(shè)、匯聚萬P(1P約等于每秒1000萬億次的計(jì)算速度)級高性能算力資源,在京內(nèi)及環(huán)京地區(qū)建設(shè)大規(guī)模算力中心,并通過人工智能數(shù)據(jù)開放共享監(jiān)管沙箱試點(diǎn)、開放應(yīng)用場景等方式,建設(shè)中國人工智能產(chǎn)業(yè)高地與示范區(qū)。

“作為全國創(chuàng)新策源地,海淀要從算力、數(shù)據(jù)、算法、框架、場景應(yīng)用、倫理等多方面出發(fā),打造人工智能產(chǎn)業(yè)發(fā)展的示范區(qū),并輻射全國。”中關(guān)村科學(xué)城管委會專職副主任何建吾說。
數(shù)據(jù)、算力、算法是人工智能發(fā)展的三大要素。據(jù)19日公布的最新數(shù)據(jù),海淀區(qū)圍繞人工智能基礎(chǔ)軟硬件設(shè)施、關(guān)鍵核心技術(shù)、行業(yè)應(yīng)用等環(huán)節(jié)進(jìn)行全產(chǎn)業(yè)鏈布局,目前已集聚人工智能企業(yè)近千家,占全市的三分之二、全國的六分之一,其中大模型企業(yè)、機(jī)構(gòu)超80家,且數(shù)量持續(xù)增長。與人工智能企業(yè)快速發(fā)展相伴的,是不斷增長的算力需求,全國乃至全球甚至一度出現(xiàn)“算力荒”問題。
為了給人工智能企業(yè)提供充足的算力供給,海淀區(qū)將推動智能算力建設(shè),加快建設(shè)、匯聚萬P級高性能算力資源。何建吾介紹,除了組織相關(guān)企業(yè)在京建設(shè)算力中心外,海淀還將通過跨域統(tǒng)籌為區(qū)內(nèi)人工智能企業(yè)提供更多普惠、開放的公共算力服務(wù),在京內(nèi)及環(huán)京地區(qū)建設(shè)大規(guī)模算力中心,持續(xù)推動國產(chǎn)芯片集群評測、適配驗(yàn)證、迭代升級。例如在天津武清,北京人工智能算力的武清節(jié)點(diǎn)正在建設(shè)中,未來還將探索在內(nèi)蒙古等環(huán)京區(qū)域探索算力中心的統(tǒng)籌布局。
作為信息時(shí)代的寶貴資源,數(shù)據(jù)被稱為人工智能的“燃料”。業(yè)內(nèi)人士透露,即便以相同的算法和算力為基石,用不同的數(shù)據(jù)去“投喂”AI模型,也會對模型的效果產(chǎn)生巨大影響?;ヂ?lián)網(wǎng)中的公開數(shù)據(jù)大家都可以通過各種渠道去獲取,然而,這些公開渠道獲取的數(shù)據(jù)“燃料”中包含大量雜質(zhì),需要花費(fèi)較高的成本對數(shù)據(jù)中的“雜質(zhì)”進(jìn)行辨別、清洗。而一些有版權(quán)限制的高質(zhì)量數(shù)據(jù),例如書籍、雜志、期刊等相關(guān)數(shù)據(jù)能否被AI大模型調(diào)用,目前尚未有成型的法律監(jiān)管約束或支持。針對人工智能行業(yè)發(fā)展對高質(zhì)量數(shù)據(jù)的渴求,中關(guān)村科學(xué)城將積極探索人工智能數(shù)據(jù)開放共享監(jiān)管沙箱試點(diǎn),加快互聯(lián)網(wǎng)數(shù)據(jù)、高質(zhì)量版權(quán)數(shù)據(jù)、公共數(shù)據(jù)的匯集共享,營造包容審慎的創(chuàng)新環(huán)境。
此外,海淀將圍繞大模型發(fā)展需求,提供多種開源、共性工具,支撐智算集群穩(wěn)定運(yùn)行及模型高效訓(xùn)練,并將在城市管理、新型工業(yè)化等方面率先向人工智能企業(yè)開放應(yīng)用場景,加速讓人工智能技術(shù)賦能經(jīng)濟(jì)社會發(fā)展的方方面面。
來源:北京日報(bào)客戶端記者孫奇茹