近日,一項關(guān)于利用大型語言模型(LLM)進行航天器自主控制的研究引起關(guān)注。研究人員通過模擬競賽的方式,測試了 ChatGPT 在航天器操控方面的表現(xiàn)。結(jié)果顯示,ChatGPT 在自主航天器模擬競賽中取得了第二名的優(yōu)異成績,僅次于一個基于不同方程的模型。這一成果不僅展示了 LLM 在航天領(lǐng)域的應(yīng)用潛力,也為未來的航天自主系統(tǒng)開發(fā)提供了新的思路。
隨著航天技術(shù)的不斷發(fā)展,衛(wèi)星數(shù)量不斷增加,未來人類將無法手動控制所有衛(wèi)星。此外,在深空探測中,光速的限制使得我們無法實時直接控制航天器。因此,開發(fā)能夠自主進行決策的機器人系統(tǒng)成為航天領(lǐng)域的重要發(fā)展方向。為了推動相關(guān)技術(shù)的創(chuàng)新,近年來航空航天研究人員創(chuàng)建了基于熱門游戲《坎巴拉太空計劃》的“坎巴拉太空計劃微分博弈挑戰(zhàn)賽”。這一挑戰(zhàn)賽為研究人員提供了一個相對真實的環(huán)境,用于設(shè)計、實驗和測試自主系統(tǒng)。競賽包括多種場景,例如追逐和攔截衛(wèi)星的任務(wù),以及躲避探測的任務(wù)。
在即將發(fā)表于《空間研究進展》雜志的一篇論文中,一個國際研究團隊介紹了他們的參賽方案:一款商業(yè)化的 LLM,類似于 ChatGPT 和 Llama。研究人員選擇使用 LLM 的原因在于,傳統(tǒng)的自主系統(tǒng)開發(fā)方法需要經(jīng)過多次訓(xùn)練、反饋和優(yōu)化,而坎巴拉挑戰(zhàn)賽的使命是盡可能真實地模擬現(xiàn)實情況,這意味著任務(wù)可能僅持續(xù)數(shù)小時,因此持續(xù)優(yōu)化模型是不切實際的。相比之下,LLM 已經(jīng)在大量人類文本上進行了訓(xùn)練,因此在最佳情況下,它們只需要經(jīng)過少量的精心提示詞工程和幾次嘗試,就能為特定情境找到合適的上下文。
據(jù)IT之家了解,為了使 LLM 能夠?qū)嶋H操控航天器,研究人員開發(fā)了一種方法,將航天器的狀態(tài)和目標以文本形式進行描述,并將其傳遞給 LLM,請求其提供關(guān)于如何調(diào)整和操縱航天器的建議。隨后,研究人員開發(fā)了一個轉(zhuǎn)換層,將 LLM 基于文本的輸出轉(zhuǎn)換為能夠操作模擬航天器的功能代碼。通過一系列簡單的提示詞和一些微調(diào),研究人員成功讓 ChatGPT 完成了挑戰(zhàn)中的許多測試任務(wù),并最終在競賽中獲得第二名。
值得注意的是,這些研究工作是在 ChatGPT 最新的 4.0 版本發(fā)布之前完成的。盡管如此,LLM 在航天領(lǐng)域的應(yīng)用仍面臨諸多挑戰(zhàn),尤其是避免“幻覺”(即無意義的、不合理的輸出)的問題。在現(xiàn)實場景中,這種錯誤輸出可能會帶來災(zāi)難性的后果。然而,這一研究結(jié)果仍然充分展示了即使是現(xiàn)成的 LLM,在吸收了大量人類知識后,也能以意想不到的方式被應(yīng)用于實際工作中。