計算機為什么不能從空中觀察地球,并且自動繪制道路、建筑和垃圾堆的地圖呢?專業(yè)衛(wèi)星經營公司 DigitalGlobe正與亞馬遜、中央情報局(CIA)風投部門以及芯片生產商Nvidia合作,試圖實現(xiàn)這個設想。
在一個聯(lián)合項目中,DigitalGlobe今天發(fā)布了整個里約熱內盧的衛(wèi)星航拍圖像,分辨率可達50厘米。在整個城市大約1900平方公里的土地上,20萬座建筑的輪廓線被手動標示于航拍圖中。被稱為 SpaceNet的這個數據集,將被用來啟動一個機器學習算法的訓練項目,為了讓機器能夠自動將航拍圖像轉換成圖形數據。
DigitalGlobe發(fā)言稱 SpaceNet數據集最終將包括地球上50萬平方公里地區(qū)內的高分辨率航拍圖像,數據中除了建筑輪廓外還會加入別的信息標注。
DigitalGlobe的數據遠比能夠在網上獲取的NASA航拍等數據詳細得多,網上的數據一般只能達到10米左右的分辨率。亞馬遜將在它的云計算服務中發(fā)布 SpaceNet數據。 Nvidia將為機器學習研究者提供工具,幫助他們對基于這些數據的機器學習算法進行訓練和測試。CIA風投部門 In-Q-Tel的一個專注于宇宙空間的分支機構 CosmiQ Works也在支持這個項目的運行。
“我們需要開發(fā)出處理這類數據的新算法。” DigitalGlobe資深副總裁 Tony Frazier說。這個公司經營著四個航拍衛(wèi)星,為美國情報機關、人道機構等組織提供數據,目前從這些圖像中提取所需數據的工作主要依靠人力來完成。
Frazier說,應該能夠通過訓練軟件來自動完成很多任務,包括繪制棚戶區(qū)的道路和建筑、跟蹤公園座椅、公交站牌等城市公共設施的變化,以及識別建筑和其它構筑物屋頂的材質等。他說這類的信息可能具有商業(yè)價值,還能幫助醫(yī)療救助項目。
一家通過公共衛(wèi)星圖像預測作物產量的創(chuàng)業(yè)公司 Descartes Labs的CEO Mark Johnson說,這些新數據應該很受創(chuàng)業(yè)公司和研究者的歡迎。他指出,其潛在的應用包括從城市區(qū)域的活動情況預測經濟產出,或者幫助城市政府改善垃圾處理和運輸等服務。
SpaceNet數據將在 ImageNet中進行標注建模,這是一個100萬張帶有標注的圖片庫,多年來這個庫一直被用于支持圖片識別的研究,也包括最近讓圖片識別準確度突飛猛進的研究。Google和Facebook等公司的圖片識別技術最早就是在 ImageNet上進行測試的。