首页 > 科技未来 > 内容

GPT-4距离成为“天网”还有多远？微软最新研究揭示：已经初具规模

发布于：2024-06-21 编辑：匿名来源：网络

在很多科幻电影中，我们经常看到电影描绘一个名为角色的AI系统或智能机器人，可以独立思考并自动执行任务。

比如《: 太空漫游》设计了一个超级智能计算机HAL来管理宇航员的任务；《终结者》塑造了自主学习人工智能系统天网，旨在控制美国核武器和防御系统以确保国家安全。

这些能够像人类一样思考和推理并具有广泛的认知技能和能力的人工智能系统被称为AGI（人工智能）。

AGI的智能并不局限于特定领域或任务，还包括推理、计划、解决问题、抽象思维、理解复杂思想、快速学习和经验学习的能力。

例如，尽管Alpha GO在围棋世界中是独一无二的，但它并不被认为是AGI。

相比之下，《机器人总动员》中的Wall-E更符合人类AGI的定义。

GPT-4距离成为“天网”还有多远？微软最新研究揭示：已经初具规模

AGI的概念在人工智能领域已经存在了几十年，许多研究人员一直在尝试通过开发新的算法、模型和方法来实现AGI。

我们离实现通用人工智能还有多远？微软研究院近期发布的论文指出，OpenAI最新的大语言模型GPT-4已经具备了AGI的雏形。

GPT-4 的广泛功能，包括涵盖广泛领域的许多功能，以及在广泛任务上的人类水平或以上的性能，让我们可以有把握地说，GPT-4 是迈向 AGI 的重要一步。

人工智能的火花这篇来自微软研究院的论文总共有页数，里面全是研究人员给出GPT-4的测试题。

▲ 图片来自：YouTube @AIExplained 由于全文很长，YouTube 博主 AIExplained 对全文进行了精选和浓缩，让我们跟随他的视角直观地了解 GPT-4 的能力。

需要注意的是，这些来自微软的研究人员在GPT-4的早期开发阶段就已经接触过该模型，并进行了大约6个月的实验。

他们使用的是无限制的开发版本，而不是现在有安全限制的最终版本，因此文章中提出的结论仅针对原始的 GPT-4 模型。

我们开始谈正事吧。

文章指出，GPT-4 的一个重要新能力是能够在很少或根本没有指令的情况下正确使用工具，例如使用计算器，这是 GPT-3.5 版本的 ChatGPT（以下简称 GPT）所具备的功能。

老版本的ChatGPT）做不到。

到达的。

提示：有一条河流从左向右流过，河边有一片沙漠，有金字塔，屏幕底部有4个按钮，颜色分别是绿色、蓝色、棕色和红色。

研究人员发现，GPT-4可以与Stable Diffusion结合，根据文字提示输出详细的图片，并根据文字提示排列物体，提高使用效率。

人类与其他动物的一个重要区别在于，人类发现并使用工具，而现在人工智能正在向这个方向慢慢发展。

研究人员还让 GPT-4 在 LeetCode 上参加了软件工程师模拟考试。

以五次考试的最佳成绩为样本，GPT-4在简单、中等、困难三个级别的考试中分别取得了86.4%、60%和14.3%的成绩。

论文谦虚地表示，GPT-4的编码水平接近人类水平。

那么人类的表现是什么呢？ LeetCode的数据库显示，人类在简单、中等和困难三个级别的考试中的平均分数分别为72.2%、38.7%和7%。

这是排除了无法回答单个问题的人后的数据。

可以说，就编程能力而言，GPT-4已经比很多软件工程师都要优秀了。

GPT-4不仅可以完成普通的编程工作，还能够进行复杂的3D游戏开发。

论文提到，GPT-4 使用 JavaScript 以零样本的 HTML 形式生成避障游戏演示。

只要在此基础上稍加优化，这个demo就可以变成游戏产品。

当研究人员用同样的提示测试旧版本的 ChatGPT 时，后者表示无法做到这一点。

为了测试其推理，研究人员给了它一个 2016 年国际数学奥林匹克竞赛的问题。

▲ 你也可以挑战一下～由于GPT-4数据库才更新到2018年（虽然是开发版本，但还没有联网），这个问题的答案并不在它的数据库里，所??以必须完全依靠数理逻辑推理能力来完成。

GPT-4回答了正确的解题逻辑，但具体答案有错误。

研究人员表示，这是基本计算中的错误（就像有人在考试时将乘法转换为除法一样），而 ChatGPT 那么它只能生成逻辑上不连贯的答案，水平还差得远。

当被问到“游泳池里可以放多少个高尔夫球？”等难题时。

GPT-4也能以合乎逻辑的方式回答。

随后研究人员发现，GPT-4可以调用其他应用程序的API来完成检索用户电子邮件、日历、坐标等操作，从而帮助人们订餐、订票、回复电子邮件等辅助任务。

这在 OpenAI 最近发布的 ChatGPT 插件集的功能中得到了体现。

GPT-4 模型绝对可以做的不仅仅是生成文本。

通过与其他应用API结合，可以成为类似于系统的存在。

研究人员还发现了一个难以检测的功能，那就是GPT-4可以构建人类心理模型。

研究人员为其设置了一个场景，GPT-4很好地分析了场景中人的心理过程以及相应的动作。

换句话说，GPT-4可以像人类一样解释人类行为和心理之间的联系，而不是简单地看到行为本身。

这是人工智能的重大进步。

还有一件事？本文分为十章，分别介绍了GPT-4的多模态能力（与视觉生成内容相关）、生成和理解代码的能力、数学能力、与世界的交互能力、与人类的交互能力。

歧视，以及 GPT-4 的局限性、社会影响和未来方向。

全文深入浅出地全面讲解了GPT-4的能力。

一经推出，就受到广泛关注并走红。

有趣的是，有网友发现作者在论文的LaTeX源代码注释中隐藏了一些信息。

▲ 从评论来看，DV-3 应该是达芬奇 3（Da Vinci 3）。

例如，GPT-4的内部名称实际上是DV-3。

同时，它也是本文的“第三作者”，或许是考虑到隐私问题而被作者有意隐藏。

网友还发现，作者并不清楚 GPT-4 的实际成本，似乎错误地将 GPT-4 称为纯文本模型而不是多模态模型。

论文中与有毒内容相关的部分在发表时也被删除，或许是为了避免给 OpenAI 带来不必要的负面影响。

总的来说，如果你对 GPT-4 能做什么、它目前的局限性是什么感兴趣，或者对 AI 的进展感兴趣，你可以通过本文了解更多关于最强大的大型语言模型的信息。

原文地址在这里：it。

站长声明

标签：

上一篇：史上最牛逼的PPT，沙特阿拉伯没人会吹嘘的

下一篇：为什么vivo Pad2能够独树一帜？

普洛斯ASP管理园发布首份可持续发展报告

投资界（ID：pedaily）据8月3日消息，普洛斯中国最大的基础设施资产管理服务公司——普洛斯资产运营服务（以下简称“普洛斯ASP”）上海安博ASP管理园ESG实践成果发布会。其管理的甘肃公航路金融仓储基地获得英国建筑研究院（BRE）颁发的绿色建筑运营标准BREEAM In-Use“杰出

06-17
雾芯科技2020年由盈转亏，营收同比增长146.5%至38亿元

美股上市公司雾芯科技（RLX.US）发布四季度及全年财报报告。财报显示，雾芯科技第四季度营收16.2亿元，同比增长44.5%；毛利率为42.9%，去年同期为39.1%；净亏损2.4亿元，而去年同期净利润1万元。

06-17
春秋航空99元的机票真的便宜吗

中秋国庆节到了，又有心情去旅行了。高铁一票难，普通飞机又贵，低成本航空公司的好处写在名字上：机票便宜。然而，一些经历过的人却觉得低廉的票价令人沮丧，并愤怒地称其为“天上的绿皮”。如果您在没有阅读说明的情况下乘坐廉价航空公司的航班，您不会觉得自己省了钱。

06-21
耀明医疗完成近5亿元D+轮融资，云峰基金领投

据3月15日消息，上海耀明医疗科技有限公司（以下简称：耀明医疗）公告完成总额近5亿元的D+轮融资。本轮投资由云锋基金领投，弘晖资本、江苏瑞华资本、八方资本、易方达基金、领道资本等跟投，百榕资本担任独家投资方。作为国内领先的平台型创新医疗器械研发及产业化公司，耀

06-17
东南亚网约车公司巨头Gojek获12亿美元融资

据投资界消息，据外媒报道，东南亚网约车公司巨头Gojek融资12亿美元用于扩张，确保资金与竞争对手 Grab 竞争。不过，Gojek并未具体说明他的新资金将来自哪里。但有传言称，亚马逊是有兴趣加入此轮融资的公司之一。据报道，随着冠状病毒大流行加速并引发全球股市暴跌，新一

06-17
风火地完成新一轮战略融资

据投资界10月21日消息，据36氪报道，专注于服务线下中小微企业的风火地近日完成新一轮战略融资，投资人为云曦一号基金。风火地隶属于杭州蓝川科技有限公司，最初为淘宝“不需要ERP的小电商”提供电商SaaS服务，包括店铺管理、订单处理等。 2017年，在保留其电商SaaS业务方面

06-17
一汽解放：公司今年累计销量120772辆，同比增长60.93%

一汽解放公告，公司2月份汽车产量8辆，今年累计产量1辆，同比增长78.96%； 2月份汽车销量为0辆，今年累计销量为72辆，同比增长60.93%。

06-17
深耕三维视觉全栈技术和产品，“陆神视”获超1.5亿元B轮融资

据投资界（ID：pedaily）1月5日消息，据工业界而商业信息显示，卢绅士新年新增更多投资人。据悉，鲁深石新引入的投资者包括：国科新能源、红砖东方、华安紫园、合肥创新投资、众安资本等，B轮融资超1.5亿元并已完成。本轮融资将用于市场拓展和供应链完善。安徽陆神视科技

06-18
比利时累计光伏装机容量达到7GW里程碑

根据比利时能源社区协会发布的最新数据，比利时去年安装了约MW的新光伏系统，而2017年和2018年分别新增光伏装机容量1,500MW。兆瓦、兆瓦和兆瓦。加上去年的新增装机，比利时累计光伏装机容量超过7GW。

06-08
云信达获1亿元B轮融资，由SIG海纳亚洲

投资界（ID：pedaily）7月15日消息，近日，云信达科技宣布完成1亿元B轮融资，本次融资由SIG海纳普亚领投，南京高新创投、中南投资跟投，老股东联想创投继续跟投。云信达科技CEO张兵表示，本轮融资将主要用于CDM技术研发，立足信息产业创新生态，打造世界一流的CDM产品。同时

06-17
关联交易是否涉及利益输送？融智日新回复科创板IPO问询

2月10日，我们获悉，安徽融智日新科技股份有限公司（以下简称：融智日新）于2月10日回复科创板IPO 2 月 9 日问。本轮问询中，上交所关注了融智日新股权结构、技术、业务等六大问题，共涉及25个问题。听，中小企业反馈平台。倾听用户需求，倾听创业者声音，解决中小企业痛

06-18
「华宇安」获数千万元A轮融资

一家专注于漏洞管理和AI攻防的安全厂商，北京华宇安信息技术有限公司正式完成数千万元A轮融资融资。本轮投资方为知名风投机构DCM，Crypto Capital担任独家投资方。本轮融资后，公司计划继续提升技术实力和产品能力，夯实人才梯队建设，持续打造云原生安全生态，强化漏洞管理

06-18