據(jù)路透社報道,非營利機構 METR 的最新研究發(fā)現(xiàn),和大家普遍認為的相反,經驗豐富的軟件開發(fā)者在使用最先進的 AI 工具輔助熟悉的代碼庫時,反而變得更慢,而不是更快。
該機構對一批資深開發(fā)者進行了深入調查,他們用流行的 AI 編程助手 Cursor 來完成自己熟悉的開源項目任務。
研究開始前,這些開發(fā)者預計 AI 能讓自己的工作速度提升,估計任務時間會縮短 24%。完成任務后,他們依然覺得自己節(jié)省了 20% 的時間。但研究數(shù)據(jù)顯示,AI 實際讓任務完成時間增加了 19%。
研究負責人喬爾?貝克和內特?拉什表示,這結果令人非常意外。拉什甚至在研究前預期速度會翻倍。
這項發(fā)現(xiàn)挑戰(zhàn)了“AI 能顯著提升高薪工程師效率”的普遍看法,而這正是吸引大量投資進軍 AI 軟件開發(fā)領域的重要原因。更有甚者,還將 AI 看作將初級程序員崗位的“替代品”。
過去研究中,AI 在提升開發(fā)效率上取得了顯著成果:一項顯示程序員速度提高了 56%,另一項表明開發(fā)者在固定時間內能多完成 26% 的任務。
但 METR 的新研究表明,這些積極結果并不適用于所有情況。尤其是對熟悉大型成熟開源代碼庫的資深開發(fā)者來說,反而出現(xiàn)了效率下降。
研究作者指出,很多相關研究依賴 AI 開發(fā)的基準測試,這些測試未必能真實反映現(xiàn)實工作任務。IT之家從報道中獲悉,效率變慢的主要原因,是開發(fā)者需要花時間檢查和修正 AI 給出的代碼建議。
貝克說:“AI 提出的建議方向基本正確,但細節(jié)上并非完全符合實際需求。”
作者強調,這種變慢不太可能出現(xiàn)在初級開發(fā)者或對不熟悉代碼庫的工程師身上。
不過大部分參與研究的開發(fā)者和作者本人依然使用 Cursor。他們認為,AI 讓開發(fā)過程更輕松愉快,就像修改一篇文章,而不是從空白開始寫作。貝克表示:“開發(fā)者的目標不僅是盡快完成任務,他們更愿意選擇這條付出更少努力的路。”