2024-10-08 04:26:47
一切都在加速发生ღ★。当黄仁勋说“编程已经不 再需要学习”的时候ღ★,人们没意识到事情会如此快的到来ღ★。
一个在得到用户需求后ღ★,完全不需要人再去参与的AI编程Agent“Devin”来了ღ★。就这么悄无声息突然来了老崔出击ღ★。
首先是程序员们每天都在做的那些基础工作ღ★,开发ღ★,调试ღ★,debugღ★,部署等等ღ★。Devin可以一气呵成自助完成ღ★。它拥有自己的shellღ★、代码编辑器和浏览器等常见开发者工具尊龙凯时人生就是博·官方ღ★,它们都集成在一个沙盒计算环境中ღ★,这样Devin就可以自己去调用ღ★。
在这些展示中ღ★,用户给出了一个自然语言描述出来的需求ღ★,接下来就跟看着一个程序员远程操作一样ღ★,Devin自己就开始各种开发动作ღ★,你能看到它打开代码编辑器ღ★,使用浏览器ღ★,进行debugღ★,运行代码尊龙凯时人生就是博·官方ღ★,检查代码ღ★,到最终部署完扔给你最终你需要的那个网站或应用ღ★。
比如程序员们每天都在干的debug的工作ღ★,Devin只需你提供一个指向 GitHub 问题的链接ღ★,就会完成所有必要的设置和上下文收集ღ★。开发者展示了一个让Devin 自己解决 sympy Python 代数系统中关于对数计算错误的例子ღ★。在展示中ღ★,Devin 搭建了代码环境ღ★,重现了错误ღ★,并独立编码和测试了修复方案ღ★。
比如它能够端到端构建和部署应用程序ღ★。比如ღ★,当你告诉它你想要一个模拟生命游戏的交互式网站ღ★,它就可以自动的开始一步步实现ღ★,甚至最终把应用程序部署到 Netlifyღ★。
而且ღ★,对于今天最热门的大模型技术ღ★,它也能独立完成ღ★。比如它仅仅需要你发给它一个指向 GitHub 研究仓库的链接尊龙凯时ღ★,ღ★,就自主为一个大语言模型完成了微调ღ★。甚至在Upwork上交给它一个真实的工作任务ღ★,它也可以编写并调试运行计算机视觉模型的代码ღ★。最后甚至抽样结果数据ღ★,编写了一份报告给你ღ★。
大家都见过的隐藏在一 幅背景图里的AI生成的艺术字吧ღ★,这个的难点在于它对于传统的软件工程师来说ღ★,也需要花一定时间了解和学习新的工具才能实现ღ★,结果ღ★,Devin只靠着自己阅读博客ღ★,就学会了这个全新的陌生技术ღ★,在Modal上运行起来了ControlNet尊龙凯时人生就是博·官方ღ★,完成了这个需求ღ★。
Devin背后的初创公司Cognition AI在3月12日发布了一系列展示老崔出击尊龙凯时-人生就是博中国官方网站ღ★,ღ★,并首次介绍了这款产品ღ★。
在官方博客中ღ★,它被描述为下一个时代的软件开发助手ღ★,不仅仅提供编码建议和自动完成一些任务ღ★,而是能够独立完成整个软件项目ღ★。这意味着Devin与其他大模型的编程能力不同ღ★,它更加的自主ღ★,在编程任务上的能力更加全面尊龙凯时ღ★!ღ★。
“通过我们在长期推理和规划方面的进步ღ★,Devin 能够规划并执行需要数千个决策的复杂工程任务ღ★。Devin 能够在每一步回忆起相关的上下文老崔出击ღ★,随时间学习ღ★,并纠正错误ღ★。”
它是一个不知疲倦ღ★、技术娴熟的团队成员ღ★,无论是与你并肩作战还是独立完成任务供你审查ღ★,它都已准备好ღ★。有了 Devinღ★,工程师们可以专注于更有趣的问题ღ★,工程团队可以追求更宏伟的目标ღ★。
团队强调ღ★,Devin是与人协同的Agent数位控制ღ★。ღ★,它有“与用户积极协作的能力”ღ★。比如ღ★,它会实时报告开发进度ღ★,接受人类反馈ღ★,并根据需要与你一起进行设计选择ღ★。
在基于真实世界编程任务进行测试的SWE-bench基准测试中ღ★,Devin在解决开源项目(如Django和scikit-learn)中的真实GitHub问题方面表现出色ღ★,正确解决了13.86%的问题ღ★,这一比例远超过当前的GPT-4和Claude等顶级模型ღ★。
Devin背后的公司叫做Cognition AI尊龙凯时(中国)人生就是搏!ღ★,目前只有10个人老崔出击ღ★,在硅谷和纽约办公ღ★,甚至都还没有自己的固定办公室ღ★,就已经从彼得·蒂尔领导的风险投资公司 Founders Fund 和其他知名投资者那里筹集了 2100 万美元ღ★,相当于人民币1.5亿的融资老崔出击ღ★。
创始团队中ღ★,又是华裔面孔ღ★。Scott Wu为首席执行官老崔出击ღ★,Steven Hao为首席技术官ღ★,Walden Yan担任首席产品官ღ★。其中Scott帮美国队拿到过国际编程奥赛的冠军尊龙凯时人生就是博·官方ღ★,有和他一起参加过数学竞赛的人称他是个绝对的天才ღ★,“碾压所有人”ღ★。他14年前参加电视直播的数学竞赛的录像在推特上刷屏ღ★。比赛里他碾压式的展示了自己的数学智商ღ★。
Steven Hao此前是Scale AI的工程师ღ★,而Walden Yan是从哈佛大学辍学ღ★,甚至“还没有跟父母聊这个决定”ღ★。
大神Karpthy称ღ★,Devin 是一个令人印象深刻的演示ღ★,它可能就是自动化编程接下来会发生的事情ღ★:协调开发人员编写代码所需的许多工具ღ★:终端ღ★、浏览器ღ★、代码编辑器等ღ★,以及人类监督ღ★,这些工具逐渐提高到更高的水平抽象ღ★。
“无论如何ღ★,软件工程有望发生重大变化ღ★。它看起来更像是监督自动化尊龙凯时-人生就是搏!ღ★,同时用英语提出高级命令ღ★、想法或进展策略ღ★。祝团队好运ღ★!”
Perplexity 的创始人Srinivas表示惊叹ღ★,称它是真正意义上的第一个达到了人类水平门槛并可以可靠的工作的AI Agentღ★。
但这款产品目前也依然没有全面对外开放ღ★,有开发者认为老崔出击ღ★,这是因为它的生成依然很慢ღ★,而且成本昂贵ღ★,在成本降下来之前ღ★,雇用几个实习生来完成这些编程任务依然是最划算的选择ღ★。
不过ღ★,据使用过它的媒体称ღ★,Devin可以在5到10分钟内从零开始构建一个网站ღ★,它设法在大约相同的时间内重新创建了一个基于Web的小游戏尊龙凯时人生就是博·官方ღ★。有测试过它的计算机科学家称ღ★:
“它已经不像是一个帮助编写代码的助手ღ★,更像是一个真正的工作者在做自己的事情ღ★。这感觉非常不同ღ★,因为它是一个可以为你做一些事情的自主系统ღ★,大多数其他助手在四五个步骤后就不行了ღ★,但Devin几乎毫不费力地在整个工作中保持连贯ღ★。”