Google人工智能研發(fā)實驗室DeepMind認為,提高人工智能系統(tǒng)能力的關鍵可能在于發(fā)現(xiàn)解決具有挑戰(zhàn)性的幾何問題的新方法。為此,DeepMind今天發(fā)布了AlphaGeometry--該實驗室聲稱該系統(tǒng)能夠解決的幾何問題與國際數(shù)學奧林匹克金牌得主的平均水平相當。

AlphaGeometry的代碼已于今天上午開源,它能在標準時限內解決25個奧數(shù)幾何問題,超過了之前最先進系統(tǒng)的10個。
Google人工智能研究科學家Trieu Trinh和Thang Luong在今天上午發(fā)表的一篇博文中寫道:"解決奧林匹克級的幾何問題是開發(fā)深度數(shù)學推理的一個重要里程碑,是邁向更先進、更通用的人工智能系統(tǒng)的必經(jīng)之路。[我們]希望......AlphaGeometry能夠幫助我們在數(shù)學、科學和人工智能領域開辟新的可能性"。
為什么關注幾何?DeepMind斷言,證明數(shù)學定理,或從邏輯上解釋為什么一個定理(如勾股定理)是真的,既需要推理,也需要從一系列可能的步驟中選擇解決方案的能力。如果DeepMind的想法是正確的,那么這種解決問題的方法有朝一日會在通用人工智能系統(tǒng)中大顯身手。
DeepMind在新聞稿資料中寫道:"證明某個猜想的真假,即使是當今最先進的人工智能系統(tǒng)也力不從心。朝著這個目標,能夠證明數(shù)學定理......是一個重要的里程碑,因為它展示了對邏輯推理的掌握和發(fā)現(xiàn)新知識的能力。"
但是,訓練人工智能系統(tǒng)解決幾何問題帶來了獨特的挑戰(zhàn)。
由于將證明轉化為機器能夠理解的格式非常復雜,因此可用的幾何訓練數(shù)據(jù)非常匱乏。而當今許多尖端的生成式人工智能模型雖然在識別數(shù)據(jù)中的模式和關系方面表現(xiàn)出色,但卻缺乏通過定理進行邏輯推理的能力。
在設計AlphaGeometry的過程中,該實驗室將"神經(jīng)語言"模型(一種在架構上與ChatGPT類似的模型)與"符號推導引擎"(一種利用規(guī)則-如數(shù)學規(guī)則來推斷問題解決方案的引擎)配對使用。符號引擎可能不夠靈活且速度較慢,尤其是在處理大型或復雜的數(shù)據(jù)集時。但DeepMind通過讓神經(jīng)模型"引導"推理引擎找出給定幾何問題的可能答案,緩解了這些問題。

為了代替訓練數(shù)據(jù),DeepMind創(chuàng)建了自己的合成數(shù)據(jù),生成了1億條"合成定理"和不同復雜程度的證明。然后,實驗室在合成數(shù)據(jù)上從頭開始訓練AlphaGeometry,并在奧林匹克幾何問題上對其進行評估。
奧林匹克幾何問題以圖表為基礎,在解題前需要添加"構造",如點、線或圓。應用于這些問題時,AlphaGeometry的神經(jīng)模型會預測哪些構造可能需要添加--AlphaGeometry的符號引擎會利用這些預測對圖表進行推理,從而找出類似的解決方案。
Trinh和Luong寫道:"有了這么多這些構造如何導致證明的例子,AlphaGeometry的語言模型就能在遇到奧林匹克幾何問題時為新的構造提出好的建議。一個系統(tǒng)提供快速、'直觀'的想法,而另一個系統(tǒng)則提供更深思熟慮、理性的決策。"
AlphaGeometry的解題結果發(fā)表在本周的《自然》(Nature)雜志上,它很可能會引發(fā)一場曠日持久的爭論:人工智能系統(tǒng)應該建立在符號操作(即使用規(guī)則操作代表知識的符號)的基礎上,還是建立在表面看來更像大腦的神經(jīng)網(wǎng)絡的基礎上。
神經(jīng)網(wǎng)絡方法的支持者認為,智能行為--從語音識別到圖像生成時可以從海量數(shù)據(jù)和計算中產(chǎn)生。與符號系統(tǒng)相比,神經(jīng)網(wǎng)絡試圖通過統(tǒng)計近似和從實例中學習來解決任務,而符號系統(tǒng)則是通過定義專門用于特定工作的符號操縱規(guī)則集來解決任務(如在文字處理軟件中編輯一行)。
神經(jīng)網(wǎng)絡是OpenAI的DALL-E 3和GPT-4等強大人工智能系統(tǒng)的基石。但是,符號人工智能的支持者認為,神經(jīng)網(wǎng)絡并不是萬能的;這些支持者認為,符號人工智能可能更適合高效地編碼世界上的知識,在復雜的場景中進行推理,并"解釋"它們是如何得出答案的。
作為一個類似于DeepMind的AlphaFold 2和AlphaGo的符號-神經(jīng)網(wǎng)絡混合系統(tǒng),AlphaGeometry或許證明,將符號操作和神經(jīng)網(wǎng)絡這兩種方法結合起來,是尋找可通用人工智能的最佳途徑。
"我們的長期目標仍然是建立能夠在數(shù)學領域通用的人工智能系統(tǒng),開發(fā)通用人工智能系統(tǒng)所依賴的復雜問題解決和推理能力,同時拓展人類知識的前沿,"Trinh和Luong寫道。"這種方法可以塑造未來的人工智能系統(tǒng)如何發(fā)現(xiàn)數(shù)學及其他領域的新知識"。