首页 > 科技未来 > 内容

全球首个人工智能程序员来了!超越GPT-4震撼了硅谷,但取代码农还为时过早

发布于:2024-06-21 编辑:匿名 来源:网络

催生AI的职业会不会因为AI而失业?初创公司Cognition AI刚刚成立两个月前。

X一夜之间风靡一时,只因为他们的推文拥有数千万的浏览量:今天,我们很高兴向大家介绍,第一位AI软件工程师德文。

认知人工智能团队基本上是国际信息学奥林匹克竞赛的金牌得主。

代码构建了互联网的基础,而程序员仍然是一个有门槛的高薪职业。

为什么这些智商最高的人类思维聚集在一起,一步步教导人工智能钻研他们最擅长的领域?第一个接近人类的人工智能程序员,它到底有什么强大之处?认知AI对德文的定义是:世界上第一个完全自主的AI软件工程师。

暂时把规格放在一边,让我们看看 Devin 能做什么。

Devin还没有开放使用,只能通过电子邮件提交申请,所以我们现在看到的是官方案例以及一些第三方开发者和产品人员的评论。

从 Cognition AI 本身开始,他们希望 Devin 完成一项任务:在三个 API 提供商上测试大型语言模型 Llama 的性能。

他们发送了一条用自然语言写成的提示短信,然后把手从键盘上拿开,把一切都交给了德文。

Devin 首先制定了一个有明确步骤的计划,然后开始像人类程序员一样编写代码。

Devin 决定使用浏览器打开 API 文档,阅读并学习如何访问每个 API。

过程中出现了意想不到的bug。

德文说不要惊慌,会解决任何问题。

他添加了调试打印语句,并使用日志中的错误信息来找出如何修复该错误。

最终,Devin搭建并部署了一个可视化网站,不仅完成了任务,而且结果还让人赏心悦目,走进了阅卷老师的心里。

据Cognition AI博客介绍,Devin还可以完成更复杂的任务,并且具有很强的学习和调整能力。

向 Devin 发送一篇文章的链接,该文章解释了如何通过 ControlNet 等插件在 AI 图像中嵌入精确的文本。

这本来是德文不熟悉的技术,但通过自己阅读和学习知识,输出了一张带有用户英文名字的电脑壁纸。

Devin 被要求制作一个交互式网站。

Devin不厌其烦地根据用户的要求进行了修改和完善,改进了初始化页面、加快了帧速率、响应了不同尺寸的窗口。

Devin 随后将网站部署到 Web 开发平台 Netlify 上,省时、省力、省心,只把好玩、好玩的部分留给人类。

除了冲锋之外,德文也非常适合打野。

面对一个包含需要不时维护的不同算法的开源存储库,Devin 拔出剑,环顾四周,帮助发现和修复 bug。

比程序员还耀眼。

就连 Devin 也有很强的自我管理意识,可以训练和微调自己的 AI 模型。

人类的程序员可以把它放在一边,一个小时后回来看看进展如何。

▲ 这个程序员真的让AI干了一个小时。

Cognition AI 也想证明 Devin 并不是一个自娱自乐的道具,因此他们尝试在自由职业平台 Upwork 上接单,编写和调试代码来运行计算机视觉模型。

但留给德文去做吧。

Devin 有条不紊地建立了代码存储库,解决了版本冲突,从互联网上下载了图像供模型使用,对结果数据进行了采样,并编写了一份漂亮的报告,这正是资助者想要的。

不仅如此,Cognition AI at X 自豪地宣布 Devin 通过了一家行业领先人工智能公司的工程面试。

如果你是个新手,面对甲方的任务摸不着头脑,抱怨天地不应该回应,不妨把任务要求发给德文,大神就在你身边。

经过市场测试,同行之间展开了竞争。

Cognition AI 要求 Devin 进行编码基准测试 SWE-Bench,以解决开源项目中的真实 GitHub 问题。

专攻技术的 Devin 完全自力更生,端到端正确解决了 13.86% 的问题。

乍一看,颜值并不高。

与之前模型在辅助下的最佳成绩 4.8% 相比,这已经是一个巨大的进步,甚至远远超越了 GPT-4 和 Claude2 等前辈。

到目前为止,使用过 Devin 的少数用户大多对它赞不绝口。

在彭博社记者进行的实际测试中,德文仅用了 5-10 分钟就从头开始搭建了一个网站。

在同样的5-10分钟内,德文可以重复创建经典的基于网络的乒乓球游戏。

之所以说重复,是因为在这个过程中,彭博社记者多次输入提示词,以改进网站的外观、乒乓球的物理特性等,德文对每一个要求都做出了回应。

计算机科学家 Silas Alberti 发现 Devin 擅长设计项目原型、修复错误以及以图形形式显示复杂数据。

他甚至觉得德文已经不能被称为“编程助理”,而更像是软件工程师的独立助手,帮助人们自主、自主地完成任务。

斯坦福大学机器学习博士生塞拉斯·阿尔贝蒂 (Silas Alberti) 也是从 Devin 开始的。

两周前,他用它构建了一个小型 SMS 网站摘要器,并通过 Twilio 进行了部署。

使用评价非常接地气:几乎就像人类同事一样!当德文遇到问题时,我给他建议,就像管理一个初级工程师一样。

经过这次经历,这位博士生提高了自己的标准——成为一名更好的工程师,以便将来能够管理德文斯团队。

由有梦想的中国团队创建,克服代码并不是终点。

Devin背后的认知AI就像一座拔地而起的山。

它成立仅2个月前。

这 10 名员工甚至没有固定办公室,往返于硅谷的 Airbnb 和纽约的办公室之间。

但就是这样一家公司,筹集了数万美元的投资,一夜之间走红。

Cognition AI的团队目前只有10人。

中国面孔很多,人才密度太高——有DeepMind、Waymo等大公司的工作经历,还有国际信息学奥林匹克10枚金牌。

主要创始人有三位。

27 岁的首席执行官 Scott Wu 和他的兄弟 Neal Wu 也在 Cognition AI 工作。

两人从青少年时期就开始参加国际编程比赛。

他们的能力在专业圈子里非常有名,甚至让美国国家编程队超越了中国。

和东欧。

首席技术官 Stevenhao 是 Scale AI 的高级工程师,这是一家负责培训人工智能系统的初创公司。

就读于哈佛大学的首席产品官 Walden Yan 疑似退学。

吴斯科特认为,奥运会经验是他团队的优势。

向人工智能教授编程技能本质上是一个复杂的算法挑战,允许系统做出复杂的决策并预测最佳的前进路径,类似于他们在竞赛中解决的问题。

Scott Wu 甚至用一种非常浪漫的方式来表达:这就像他们在脑海中玩了很多年的游戏。

然而,在成为大公司之前,它却患有大公司病。

与日益封闭的OpenAI类似,Cognition AI没有向公众透露技术细节,也没有透露自己是否构建模型或依赖现有模型。

他们只是笼统地说,他们找到了一种将 GPT-4 等大型语言模型与强化学习技术结合起来的方法,赋予了 Devin 几项能力。

首先,德文在推理和长远规划方面取得了突破。

他可以规划和执行需要数千个决策的复杂工程任务,记住每个步骤的背景,并不断学习和修复错误。

有了推理能力,人工智能可以变得更像人类。

我们熟悉的大型语言模型通常是根据概率预测句子的下一个单词或下一个代码片段的系统。

全球首个人工智能程序员来了!超越GPT-4震撼了硅谷,但取代码农还为时过早

但拥有推理能力意味着人工智能更接近人类思考和解决问题的方式。

至于长期规划能力,这实际上决定了AI能发挥多大作用。

计算机科学家塞拉斯·阿尔贝蒂(Silas Alberti)发现,大多数编码助手在四五步后就脱轨了,但德文基本上始终在线。

彭博社甚至表示,Devin 可以连续处理数百甚至数千个任务,同时保持一致性。

这或许就是AI的“多任务处理”。

其次,工欲善其事,必先利其器。

Devin配备了人类程序员使用的所有常用开发工具,包括沙盒计算环境中的命令行界面、代码编辑器和浏览器。

此外,Devin 积极与人类合作,实时报告它计划做什么、使用哪些命令和代码以及任务完成了多少。

它虚心接受反馈,并用提示性的话语提醒德文,它会听取建议并做出调整。

根据您的需求与您合作完成项目。

Devin的演示效果足够惊人,但攻克代码并不是认知AI的结束,而是开始。

认知AI真正希望解决的是推理问题,让AI更接近人类,进而在更广泛的学科中实现更多样的可能性。

文字、图像、视频、代码,还有什么是AI学不到的?当人工智能做得更多时,人类有责任监督人工智能做得更多。

程序员要求人工智能为他做事。

这不仅仅是认知人工智能的想法。

今年6月,GitHub、微软和OpenAI推出了基于GPT-3的AI代码助手“Copilot”。

上个月,一家名为 Magic AI 的公司筹集了超过 1 亿美元,从头开始设计自己的模型和底层技术,打造“软件工程师超人”。

当GPT-3.5刚流行时,有人认为当你输入提示词时,你正在编写一个大的语言模型。

我们可以任意让AI生成一段文字或者一张图片,也可以算数,但同时,真正的编程因为AI而变得更加流行,让我们回到了一个熟悉的话题:人类的饭碗会被抢走。

去?乐观地讲,AI程序员可以将程序员从繁琐、枯燥的任务中解放出来,做更多有创意的事情。

对于编码一无所知但有头脑的新手可以构建自己的网站、服务和应用程序。

相反,悲观者可能会觉得AI程序员让程序员不再是一个高薪行业。

认知AI评论区有人发了个狂野表情:作为软件工程师,我完了。

OpenAI创始团队成员、大人物Andrej Karpathy也表达了他对X的看法。

软件工程自动化与自动驾驶的开发过程类似:1.人类手动编写代码;2.人类手动编写代码。

2. GitHub Copilot自动完成几行代码; 3. ChatGPT 编写大块代码; 4、代码差异越来越大,比如Cursor copilot++风格; 5、在这个过程中,AI做的多,人类做的少,但仍然起到监督作用。

因为 Devin 的出现,开发者编写代码需要的工具,包括终端、浏览器、代码编辑器等,可能会发生很大的变化,人工监督的抽象程度会越来越高。

不过,也别高兴得太早。

在人工智能、用户界面和体验方面还有很多工作要做。

人类如何监督、如何调试错误、如何引导人工智能、如何使用自然语言提出高级命令,仍然有待解答。

深度学习大师弗朗索瓦·乔莱(Fran?ois Chollet)有更尖锐、更有针对性的观点——软件工程不是复制粘贴代码,而是开发和运行问题及其解决方案的心智模型。

德文还没有达到这个水平。

软件工程的革命可能即将到来。

至少目前来说,人工智能还不能完全取代人类。

由于访问过于火爆,Cognition AI的官网一度瘫痪。

看来AI还无法制作出不会崩溃的网页。

与此同时,Cognition AI 仍在招募软件工程师和机器学习研究人员。

可见,此时此刻,杰出的人类程序员比以往任何时候都更加罕见,他仍然可以做伟大的事情,为人工智能做出贡献,为更多的同类留下后盾。

全球首个人工智能程序员来了!超越GPT-4震撼了硅谷,但取代码农还为时过早

站长声明

版权声明:本文内容由互联网用户自发贡献,本站不拥有所有权,不承担相关法律责任。如果发现本站有涉嫌抄袭的内容,欢迎发送邮件 举报,并提供相关证据,一经查实,本站将立刻删除涉嫌侵权内容。

标签:

相关文章

  • 金山、小米等拟设立集成电路相关领域股权投资基金

    金山、小米等拟设立集成电路相关领域股权投资基金

    金山软件 金山软件3月2日晚间发布公告,旗下子公司武汉金山、小米北京、小米武汉已与金山软件签订合作协议其他投资者。 ,内容为基金设立,预计认缴出资额为1亿元人民币。 该基金成立后,不会成为金山软件的子公司,也不纳入集团合并报表范围。 公告称,该基金将主要从事股权

    06-06

  • 国内眼科医疗器械公司“普亭医疗”完成数千万元A+轮融资,BV百度创投独家投资

    国内眼科医疗器械公司“普亭医疗”完成数千万元A+轮融资,BV百度创投独家投资

    近日,深度参与的深圳市普亭医疗科技有限公司(普亭医疗)在国内眼科医疗器械领域,正式宣布完成数千万元A+轮融资,本轮融资由BV百度创投完成。 本轮资金将用于产品线拓展、市场推广等方面。 此前,莫廷医疗下半年完成数千万元A轮融资。 投资方为中科院旗下深圳国科瑞华三期股

    06-18

  • 2021世界互联网大会博览会开幕:300余家企业黑科技亮相

    2021世界互联网大会博览会开幕:300余家企业黑科技亮相

    创造头条新闻9月25日,2021世界互联网大会“互联网之光”博览会在浙江乌镇拉开帷幕。 作为世界互联网大会“1”结构的重要功能版块,博览会将重点展示人工智能、云计算、大数据、网络安全等领域的最新前沿科技成果,以及作为数字化改革在经济、社会、政府等领域的最新应用成果

    06-18

  • 舞蹈领域垂直服务商DanceA获数千万元天使轮融资,投资方为睿鼎资本

    舞蹈领域垂直服务商DanceA获数千万元天使轮融资,投资方为睿鼎资本

    据投资界3月25日消息,舞蹈领域垂直服务商DanceA(目前专注交际舞领域)获得数千万元天使轮融资来自睿鼎资本。 本轮融资由无界资本和力源资本提供。 该公司此前已获得个人投资者数百万元的种子资金。 目前,公司业务主要分为两部分。 2B为舞蹈培训机构提供SaaS服务,以及在线

    06-17

  • 满天星完成数百万美元天使轮融资,投资方为咸丰长青

    满天星完成数百万美元天使轮融资,投资方为咸丰长青

    投资圈(ID:pedaily)据8月2日消息,深圳满天星近日宣布完成首轮数百万天使轮融资融资方面,投资者是常青树。 满天星成立于2007年,之所以选择深圳作为总部,是因为中国绝大多数的电子商务公司都集中在这里,具有得天独厚的优势。 公司致力于成为跨境电商首选物流服务运营商

    06-18

  • 零售品牌出海:如何打造国际化的客户服务体验?

    零售品牌出海:如何打造国际化的客户服务体验?

    .wp-block-column h3{margin-left:0} 在全球化浪潮中,零售品牌纷纷走出国门,拓展国际市场。 然而,如何为客户提供一致、高效、国际化的服务体验,成为品牌在海外市场竞争的关键。 沃风科技Udesk全渠道客户服务系统依托先进的技术手段,为零售品牌提供有力支持,助力打造国际

    06-18

  • 润物无声,风火迪让小微企业数字化转型触手可及——风火迪商务版发布会在杭州召开

    润物无声,风火迪让小微企业数字化转型触手可及——风火迪商务版发布会在杭州召开

    11月26日,风火迪以“小微数智的商务变得简单”为主题,打造了风火迪商务版发布会版本发布会在杭州举行。 本次大会邀请了数字经济学专家、服装行业KOL、银行高管等重量级嘉宾,与烽火地创始团队共同探讨小微企业如何抓住机遇实现数字化转型。 从创立至今,风火地始终坚守初心

    06-17

  • 快送阁完成600万元Pre-A轮融资,物流第三方服务仍是蓝海

    快送阁完成600万元Pre-A轮融资,物流第三方服务仍是蓝海

    据投资界7月10日消息,快递SaaS服务商快送阁已完成万元融资今年6月Pre-A轮融资,由三位个人投资者和头娜共同投资。 据悉,本轮融资将用于下一代智能客服软件的开发和运营。   快双哥成立于2016年10月,以智能客服SaaS软件进军快递服务市场,主要解决客户服务三大痛点:客户

    06-18

  • 起售价低于  30 万元,特斯拉 Model 3 是如何做到的?

    起售价低于 30 万元,特斯拉 Model 3 是如何做到的?

    起拍价不到30万元。 特斯拉 Model 3 是如何做到的? 2019年1月3日,特斯拉官方发布消息,宣布中国制造的特斯拉Model 3即将上市,将于1月7日交付;但最引人瞩目的还是价格——这款国产Model 3车型在享受国家新能源补贴和免购置税后售价50元起。 这是特斯拉首款起售价低于30万元

    06-17

  • 苏州将迎来超千亿资金中的资金

    苏州将迎来超千亿资金中的资金

    投资界(ID:pedaily)8月3日报道,今年下半年,总计超千亿资金中的资金将落户苏州,其中包括多只基金规模超百亿。 基金。 “欢迎大家常来苏州,深入了解苏州。 ”苏州市委常委、市长副手顾海东在7月30日举办的“中国基金中基金50人论坛”上发出邀请。 近年来,苏州已成为PE/

    06-18

  • 被收购时注意问题:创业者保持创业热情,清晰展示公司优势

    被收购时注意问题:创业者保持创业热情,清晰展示公司优势

    现在在中国,并购是买方市场。 有能力或愿意支付费用的企业相对谨慎,谈判的天平并不是倾向于被收购的一方。   在谈判过程中,最关键的是向收购方清晰地展示公司的优势。 这其实和融资是一样的。 公司优势越明显,估值越高。 在当前的中国国内市场上,最重要的是尽可能对买

    06-17

  • 润和软件成为日本Top 1芯片商瑞萨电子在中国的独家战略合作伙伴

    润和软件成为日本Top 1芯片商瑞萨电子在中国的独家战略合作伙伴

    近日,润和软件的“豪华芯片朋友圈”再次扩大。 继华为、海思、英特尔之后,日本顶级芯片商瑞萨电子宣布润和软件成为其在中国的独家战略合作伙伴,双方高管近期在南京和东京进行了友好互访。 据了解,润禾软件与瑞萨电子早在2018年就基本达成独家战略合作,双方合作的首个重大

    06-18