HPE正在收購一家名為Pachyderm的初創(chuàng)公司,該公司的軟件平臺旨在加速AI項目。
HPE在本周四宣布了這筆交易,預(yù)計交易在本月底結(jié)束,之后HPE將把Pachyderm的平臺與HPE的AI軟件組合整合在一起??偛课挥谂f金山的Pachyderm公司此前從投資方那里融資了2810萬美元。
企業(yè)軟件團隊在訓(xùn)練數(shù)據(jù)集的幫助下可以開發(fā)AI模型。建立新的神經(jīng)網(wǎng)絡(luò)后,它的任務(wù)就是分析訓(xùn)練數(shù)據(jù)集,直到學(xué)會識別信息中感興趣的模式。一旦神經(jīng)網(wǎng)絡(luò)達到足夠高的準確度,就可以部署到生產(chǎn)環(huán)境中用于處理實時信息。
工程師用來提高AI模型準確性的訓(xùn)練數(shù)據(jù)集,通常無法以原始形式進行處理。在部署訓(xùn)練數(shù)據(jù)集之前,軟件團隊必須對數(shù)據(jù)集中可能包含的任何重復(fù)和錯誤記錄進行過濾。準備過程通常還包括其他任務(wù),例如將信息轉(zhuǎn)換為可以使用較少硬件進行處理的形式。
準備AI訓(xùn)練數(shù)據(jù)集的過程是通過一種名為數(shù)據(jù)管道的自動化工作流程執(zhí)行的。Pachyderm公司提供了一個平臺,可以更輕松地構(gòu)建數(shù)據(jù)管道。該平臺可以在主流的公有云平臺以及企業(yè)本地的基礎(chǔ)設(shè)施上運行。
Pachyderm讓開發(fā)人員能夠編寫腳本來自動執(zhí)行單個數(shù)據(jù)準備任務(wù),例如刪除重復(fù)記錄等等。然后,開發(fā)人員可以將這些腳本組合到數(shù)據(jù)管道中。Pachyderm使用Kubernetes容器編排引擎運行管道,這樣就能夠根據(jù)AI項目的要求自動添加或者刪除硬件資源。
Pachyderm公司表示,他們的平臺可以為每個AI項目處理高達TB級的數(shù)據(jù),平臺可以接收結(jié)構(gòu)化的信息,例如電子表格、服務(wù)器日志和其他類型的文件。
Pachyderm對數(shù)據(jù)管道接收信息所做的更改操作創(chuàng)建了一個記錄。工程師通過評估此記錄,可以識別管道中潛在的技術(shù)問題。Pachyderm公司表示,該平臺還能夠重現(xiàn)過去AI項目的結(jié)果,從而更容易檢查這些項目的準確性。
HPE執(zhí)行副總裁、高性能計算和AI部門總經(jīng)理Justin Hotard表示:“隨著AI項目的規(guī)模越來越大,就越來越多地涉及復(fù)雜的數(shù)據(jù)集,數(shù)據(jù)科學(xué)家們需要可重現(xiàn)的AI解決方案,從而有效地最大化他們的機器學(xué)習(xí)計劃,優(yōu)化他們的基礎(chǔ)設(shè)施成本,同時確保數(shù)據(jù)可靠和安全,無論他們在AI旅程的哪個階段。”
HPE計劃將Pachyderm與HPE機器學(xué)習(xí)開發(fā)系統(tǒng)進行集成,這是一個用于訓(xùn)練AI模型的軟件平臺,該平臺基于HPE早期收購Determined AI獲得的技術(shù)。