香蕉视频久久-香蕉视频三级-香蕉视频亚洲一级-香蕉视频一级-青草国产在线-青草国产在线观看

第一位人工智能軟件工程師震驚硅谷!手里拿著10枚IOI金牌,他們決心摧毀程序員的工作——快科技——科技改變未來

   日期:2025-07-11     來源:本站    作者:admin    瀏覽:88    
核心提示:      第一位人工智能軟件工程師震驚硅谷!手里拿著10枚IOI金牌,他們決心要毀掉程序員的工作。  當我醒來的時候,程序員

  

  

  第一位人工智能軟件工程師震驚硅谷!手里拿著10枚IOI金牌,他們決心要毀掉程序員的工作。

  當我醒來的時候,程序員擔心他們真的會失去工作。

  第一位AI軟件工程師的登場,直接引爆了整個科技圈。它只需要一個命令就可以端到端地處理整個開發項目。

  在sw -bench基準測試中,它在沒有人工幫助的情況下解決了13.86%的問題。

  相比之下,GPT-4只能處理1.74%的問題,而且兩者都需要人工提示來告訴它們要處理哪些文件。

  可以說,它遠遠超過了之前所有的大型AI模型。

  從零開始建立一個網站,自己發現和修復錯誤,甚至訓練和微調自己的人工智能模型都很容易。您還可以為一些成熟的代碼庫做出貢獻。

  只要給它看一篇關于一些不熟悉的技術的博客文章。它也可以在短時間內完成。

  例如,使用ControlNet生成帶有隱藏文本的圖像,Devin只需點擊一下即可使用~

  據報道,它已經成功通過了一家人工智能公司的面試,并完成了Upwork的實際工作。

  這背后的公司,認知,雖然是一家初創公司,但規模很小,但能力很強。

  招聘信息中清楚地寫著:我們有10名國際奧委會金牌獲得者。

  讓同事說:哦莫,你瘋了~

  目前Devin還沒有公測,但已經有一小部分人獲得了資格,開始了一波實際測試……

  首個人工智能軟件工程師亮相

  Devin被介紹為世界上第一位完全自主的人工智能軟件工程師。

  它將大量精力投入到長期推理和計劃中,并且可以計劃和執行需要數千個決策才能完成的復雜軟件工程任務。

  在此過程中,它可以在任何步驟回調所有相關的上下文信息,以確保整體邏輯,并隨時方便錯誤糾正。

  由于Devin是端到端的AI,所以它也配備了軟件開發人員常用的工具,如shell、代碼編輯器、瀏覽器等(在沙盒計算環境中),專注于全方位的服務。

  最后的Devin,讓人類只發號施令,什么都不做。

  具體來說,其主要功能包括以下六個方面:

  1. 端到端構建和部署過程

  Devin不僅可以幫助我們解決代碼問題,還可以幫助我們解決與之相關的整個工作流程。

  例如,當我們需要設計一個網頁游戲時,Devin不僅可以生成網頁,還可以直接完成服務器端的部署,然后直接發布到網上,省去了中間的人工操作。

  告訴戴文,我們想做一個個人網站運行一個定制版的戴文的人生游戲。

  Devin接著說,他會先搭建網站的基本架構,然后問是否還有更具體的需求。

  在明確了需求之后,Devin給出了這樣一個任務清單:

  創建React應用程序,安裝UI模塊和其他依賴項

  使用React和UI模塊構建一個前端環境

  部署服務器并確保它在私有IP下運行

  通過CDN將p5.js庫添加到首頁

  在React中部署并驗證游戲的功能和資源是否配置正確

  然后,Devin將根據他設計的列表開始編寫代碼,然后部署服務…

  當所有的工作最終完成后,一個點擊游戲的鏈接呈現在我們面前。

  2. 獨立發現和修復bug

  不僅開發和部署可以一次完成,Devin的調試能力也是一流的。

  開發人員給了Devin一個GitHub鏈接,讓他熟悉這個項目,然后為測試準備數據。

  然后,Devin一步一步地編寫測試程序,準備相關數據,然后運行。

  因此,在開發人員發布的完整項目中,Devin實際上發現了甚至開發人員自己都沒有發現的漏洞。

  在發現漏洞后,Devin會追蹤到錯誤的位置和相應的數據,然后分析原因并提供解決方案。

  經過最后的調試,程序中的bug被成功修復,測試也完美通過。

  3. 訓練和微調你自己的人工智能模型

  除了這些通用的程序或項目,作為一個全能的人工智能助手,Devin還具有幫助人類訓練和微調其他人工智能的能力。

  對于一些常見的模型(例如示例中的Llama),用戶在推廣時只需要提到模型的名稱,Devin就會直接知道該訓練哪個模型。

  在本例中,具體的微調方法(QLoRA)以GitHub鏈接的形式輸入到Devin。

  在收到指令后,Devin仍然像一個正常的程序一樣計劃和執行它。所需的環境和依賴關系,以及模型本身,將被自動下載和安裝。

  這些準備工作完成后,微調工作將有序進行,并可以實時監控狀態。

  4. 修復開源庫

  Devin的能力不僅在于開發者自己的項目,也在于開源社區。

  例如,我們只需要將GitHub項目的issue鏈接丟給Devin,它就會立即完成所有需要的配置,自動收集上下文信息,然后開始解決問題。

  當然,來自開源項目的特性請求沒有問題。這個過程和解決問題是一樣的。您可以自己配置它,收集上下文,然后開始編碼。

  5. 成熟的生產庫也可以發揮作用

  它還沒有結束,Devin還可以向我們展示成熟的生產庫。

  根據官方介紹,sympy Python代數系統中存在對數計算錯誤,Devin成功解決了這個問題:

  配置環境、重現bug、編寫代碼并自己修復它、測試它,一步到位。

  6. 不熟悉的技術,現在就學習,現在就銷售

  最后,當遇到不懂的技能時,Devin可以直接學習并快速付諸實踐。

  把你的新技術文章的鏈接直接發給Devin:

  嗨Devin !我在這篇博客文章(url附件)中發現,有可能生成帶有隱藏文本的圖像。文章中提到了一個腳本。你能配置它并為我生成一些圖片嗎?

  Ps,用ControlNet就可以了。

  Devin收到請求后,他首先詢問了更詳細的需求,然后開始閱讀博客文章,并像往常一樣制定了行動計劃。

  有了詳細的行動計劃,在幾分鐘內立即進行了編碼和調試。

  同樣,如果您在這里遇到bug也不要驚慌,Devin也能夠直接修復它們。

  在完成工具的構建后,Devin并沒有麻煩人類自己配置和使用,而是一氣之功,最終生成了我們想要的帶有隱藏文本的圖像:

  可以說,表演相當驚人。

  在具體的測試中,德文的結果同樣令人印象深刻。

  在評估Devin的表現時,團隊沒有使用常見的Humaneval,而是使用更具挑戰性的sw -bench。

  該數據集由GitHub中的實際問題組成,Devin在沒有任何幫助的情況下達到了13.86%的最高分辨率。

  同樣在無輔助條件下,GPT-4的問題解決率為零。之前的最佳水平為1.96%,輔助水平僅為4.8%。

  全公司每人一枚IOI金牌

  在這樣一個突破性的新成就背后,是一家鮮為人知的初創公司。

  但在這個“鮮為人知”的背后,其實是一個擁有10枚IOI金牌的10位編程天才團隊……每人一枚。

  Devin背后的公司名為Cognition AI,總部位于紐約和舊金山。它的定位是一個專注于推理的應用人工智能實驗室。

  該公司在兩個月前正式成立,此前一直秘密運作。

  這支隊伍目前只有10人,但總共獲得了10枚國際奧委會金牌。創始成員都曾在Cursor、Scale AI、Lunchclub、Modal、Google DeepMind、Waymo、Nuro等AI前沿領域工作過。

  據悉,認知AI由Scott Wu、Steven Hao和WaldenYan共同創立。

  聯合創始人兼首席執行官Scott Wu。根據我們目前掌握的信息,Scott Wu曾就讀于哈佛大學,是Lunchclub的聯合創始人兼CTO。

  連續三年獲得IOI金牌;

  聯合創始人兼首席技術官Steven Hao畢業于麻省理工學院計算機科學專業,此前曾在Scale AI、Jane Street、DE Shaw和Quora工作。

  同樣是前IOI金牌得主:

  聯合創始人兼首席運營官瓦爾登曾在哈佛大學學習計算機科學和經濟學。他還從事MIT PRIMES密碼學和機器學習方向的計算機科學研究。他也是沃頓商學院高中投資競賽的北美決賽選手。

  2020年第32屆IOI金牌得主:

  根據X的推文的轉發,其中一個創始成員被曝光。

  尼爾·吳(Neal Wu)也有哈佛大學的教育經歷,曾在tryramp和GoogleBrain工作。

  整個團隊的長期目標是通過解決推理問題,在廣泛的學科領域開啟新的可能性,而“代碼只是一個開始”。

  然而,對于Devin來說,他們還沒有透露他們是如何實現這一壯舉的,包括他們是使用自己的專有模型還是第三方模型。

  此外,認知人工智能目前已經獲得了2100萬美元的A輪融資,由硅谷投資大亨彼得·蒂爾的創始人基金領投。

  眾所周知,Peter Thiel以發現這種突破性的創新項目而聞名,哈佛背景的企業家與他的關系更為密切。

  他在之前的早期投資中也有類似的背景,最著名的是扎克伯格和Facebook。

  “自動化軟件工程類似于自動駕駛”

  當Devin出現時,許多工程師都震驚了:軟件工程師……要失業了?? ?

  然而,一些人仍然樂觀:人工智能最終將我們從繁重的編程任務中解放出來。

  前特斯拉人工智能主管卡帕西給出了保證。

  自動化軟件工程目前看起來與自動駕駛類似。

  具體體現在開發過程中:先是人類手工寫代碼,然后GitHub Copilot自動完成幾行,然后ChatGPT寫代碼塊,現在Devin出現了。

  接下來,他認為自動化軟件工程將演變為協調開發人員編寫代碼所需的許多工具:終端、瀏覽器、代碼編輯器等,以及負責監督的人,逐漸轉向更高層次的工作。

  結合Kapasi對自動駕駛的經驗和理解,他所表達的更多的是一種漸進的推進,即會有一段時間的人機協同駕駛,然后經過數據和迭代反饋,就可以實現全自動駕駛。

  自動化軟件也是類似的,首先是低代碼,然后是零代碼,最后根本不需要任何人編寫代碼。

  困惑AI CEO給予了高度肯定:這應該是任何Agent的第一次演示。

  它似乎跨越了人類水平的門檻,而且工作可靠。它還告訴我們結合LLM和樹搜索算法可以實現什么

  Noam Brown,撲克AI之父,前FAIR(元)研究科學家,現在是OpenAI的成員,轉發了Kai Mic:

  2024年對人工智能來說是激動人心的一年。

  那么,程序員準備好被解放了嗎?(總督)

 
打賞
 
更多>同類文章

推薦圖文
推薦文章
點擊排行