Devin:全球首位AI程序員誕生
Cognition ai實驗室發布全球首位AI程序員 : Devin。Devin是世界上第一位能夠通過單一提示進行編碼、創建網站和軟件的AI程序員,已成功通過領先人工智能公司的實際工程面試,甚至完成了Upwork 上的真實工作,Devin是一個自主代理,通過使用自己的 shell、代碼編輯器和網絡瀏覽器來解決工程任務。包括以下的一些能力:
1、可以學習如何使用不熟悉的技術。
閱讀博客文章后,Devin 在 Modal 上運行 ControlNet,為 Sara 生成帶有隱藏消息的圖像。
2、Devin 可以端到端地構建和部署應用程序。
Devin 制作了一個模擬生命游戲的互動網站!它逐步添加用戶請求的功能,然后將應用程序部署到 Netlify。
3、Devin 可以自主查找并修復代碼庫中的錯誤。
Devin 幫助 Andrew 維護和調試他的開源競爭性編程書籍。
4、Devin 可以訓練和微調自己的人工智能模型。
Devin 只給出了 GitHub 上研究存儲庫的鏈接,即可對大型語言模型進行微調。
5、Devin 可以解決開源存儲庫中的錯誤和功能請求。
只需提供 GitHub 問題的鏈接,Devin 即可完成所需的所有設置和上下文收集。
6、Devin 可以為成熟的生產存儲庫做出貢獻。 ?
此示例是 SWE-bench 基準測試的一部分。 Devin 解決了 sympy Python 代數系統中對數計算的錯誤。 Devin設置代碼環境,重現錯誤,并自行編碼和測試修復。
Devin 的突出之處在于其超前思考和計劃復雜任務的能力。它可以做出數千個決定,從錯誤中吸取教訓,并隨著時間的推移變得更好。此外,它還擁有人類工程師所需的所有工具,例如代碼編輯器和瀏覽器,觸手可及。
Devin核心功能:
Devin 到底能做什么呢?幾乎任何你扔給它的東西。無論是學習新技術、從頭到尾構建和部署應用程序,還是查找和修復代碼中令人討厭的錯誤,Devin 都能滿足您的需求。它甚至可以訓練自己的人工智能模型并解決開源項目中的問題。
長期推理和規劃:能夠執行需要復雜決策的工程任務。
使用開發工具:掌握 shell、代碼編輯器和瀏覽器等開發者工具。
積極協作:能夠實時報告進度,接受反饋,與用戶共同作出設計選擇。
學習新技術:能夠快速掌握并應用不熟悉的技術。
構建和部署應用:從頭到尾完成應用的構建和部署。
自主發現并修復錯誤:獨立發現并解決代碼中的問題。
訓練和微調 AI 模型:設置并微調大型語言模型。
處理開源倉庫問題:應對開源項目中的錯誤和功能請求。
貢獻到成熟生產倉庫:解決復雜的生產級倉庫問題。
完成實際工作任務:能在平臺如 Upwork 上完成真實工作。
在 SWE-Bench 基準測試中,要求代理解決 Django 和 scikit-learn 等開源項目中發現的實際 GitHub 問題。Devin無需協助即可正確解決了 13.86%的問題,遠遠超過了之前 1.96% 的最佳水平。即使提供了要編輯的確切文件,以前最好的模型也只能解決 4.80% 的問題。
Devin 代表了人工智能技術的重大飛躍。通過自動化日常任務并讓工程師能夠專注于更復雜的問題,它為軟件開發創新的新時代鋪平了道路。因此,無論您是經驗豐富的工程師還是剛剛起步的工程師,Devin 都會讓您的工作比以往更輕松、更令人興奮。