近期AI寫程式方法「Vibe Coding」相當熱門,即使沒有程式基礎,只要用自然語言將開發需求告訴AI,就能快速產出可直接執行的程式碼。OpenAI上週發表的AI代理(AI Agent)Codex則更加強大,會自動修復錯誤、提出審查建議,並且能同時處理多個程式任務,成為可靠且有效率的寫程式助理。真的如此?如何使用?適用的方案、應用場景有哪些?
OpenAI 16日發布AI代理Codex的研究預覽版,這是一個在雲端上執行的AI軟體工程代理,AI能根據已連結的Github程式庫編寫新功能、回答問題,或修復錯誤。
Codex使用模型、付費免費?誰能用?
根據OpenAI官方介紹文件,Codex使用的AI模型為codex-1,是將推理模型o3針對軟體工程優化的新版本。o3為OpenAI上個月推出的新模型,也是其目前最強大的推理模型。
codex─1透過強化學習技術,在多種開發環境中執行真實的程式任務進行訓練,其能產出風格貼近人類工程師、符合提取要求(pull request)習慣的程式碼,並且會嚴格遵循指令,還能反覆執行測試直到通過為止。
目前僅有訂閱ChatGPT Pro、Enterprise與Team方案的會員可率先使用Codex,近期也將擴大開放給Plus和Edu的會員使用。OpenAI表示,目前有權使用Codex的會員可免費獲得大量使用額度,但在幾週後,則會實施速率限制,若超過使用額度需購買額外積分。
Codex怎麼用?最大優點?
目前,OpenAI最推薦使用Codex的優勢,是它可以多工寫程式。到底怎麼用?
有權限使用Codex的會員,可在ChatGPT的側邊欄找到Codex,輸入指令或上傳檔案後,點選「Code」即可指派新的程式任務;如果是想詢問Codex關於程式碼庫的問題,則可點選「Ask」。
每項指派給Codex的任務,都會在一個預先載入既有程式碼庫的獨立環境中執行,因此Codex可同時進行多項任務,提升工作效率。根據任務的複雜程度,完成時間通常介於1至30分鐘之間,使用者也可即時監控Codex的執行情況。
要將正在開發中的程式專案交給AI執行,資訊安全是相當重要的考量。對此,OpenAI表示,Codex只能存取使用者透過GitHub儲存庫提供的程式碼,以及預先安裝的套件。其在執行任務期間會關閉網路連線功能,無法連結外部網站、API或其他服務。
另一方面,為了避免Codex被用於開發惡意程式,其接受了能辨識並拒絕惡意要求的訓練,並同時確保這項保護措施不會過度阻礙其他合法的要求。
Codex是完美AI Agent?缺點在哪?
如此自動化的AI寫程式方式,會帶來什麼影響呢?OpenAI表示,未來AI代理將能處理更複雜、耗時更久的任務,而人們與AI代理的互動,會愈來愈像是與同事進行非同步協作,而不單純只是以一個口令、一個動作的方式要求AI做事。
此外,AI Agent也能讓開發者主導自己想做的工作,並將其他部分交給AI處理。根據外媒《TechCrunch》報導,普林斯頓大學研究員、SWE─Agent團隊成員利雷特(Kilian Lieret)表示,AI代理的目標是讓開發者能成為管理者,其只要將任務指派給AI代理,AI就能自主解決問題。
不過,目前AI Agent的發展距離此願景仍有一段距離。AI新創公司All Hands AI執行長布倫南(Robert Brennan)表示,人類審查程式碼在現階段仍是必要的環節,「我看過好幾個人,因為對AI產出的程式碼照單全收、自動核准,最後讓整個專案變得一團混亂。」
也因此,Codex看似完美仍需要人類審查生成的程式碼,是缺點所在。