首页 > 科技未来 > 内容

GPT-4距离成为“天网”还有多远?微软最新研究揭示:已经初具规模

发布于:2024-06-21 编辑:匿名 来源:网络

在很多科幻电影中,我们经常看到电影描绘一个名为角色的AI系统或智能机器人,可以独立思考并自动执行任务。

比如《: 太空漫游》设计了一个超级智能计算机HAL来管理宇航员的任务; 《终结者》塑造了自主学习人工智能系统天网,旨在控制美国核武器和防御系统以确保国家安全。

这些能够像人类一样思考和推理并具有广泛的认知技能和能力的人工智能系统被称为AGI(人工智能)。

AGI的智能并不局限于特定领域或任务,还包括推理、计划、解决问题、抽象思维、理解复杂思想、快速学习和经验学习的能力。

例如,尽管Alpha GO在围棋世界中是独一无二的,但它并不被认为是AGI。

相比之下,《机器人总动员》中的Wall-E更符合人类AGI的定义。

GPT-4距离成为“天网”还有多远?微软最新研究揭示:已经初具规模

AGI的概念在人工智能领域已经存在了几十年,许多研究人员一直在尝试通过开发新的算法、模型和方法来实现AGI。

我们离实现通用人工智能还有多远?微软研究院近期发布的论文指出,OpenAI最新的大语言模型GPT-4已经具备了AGI的雏形。

GPT-4 的广泛功能,包括涵盖广泛领域的许多功能,以及在广泛任务上的人类水平或以上的性能,让我们可以有把握地说,GPT-4 是迈向 AGI 的重要一步。

人工智能的火花这篇来自微软研究院的论文总共有页数,里面全是研究人员给出GPT-4的测试题。

▲ 图片来自:YouTube @AIExplained 由于全文很长,YouTube 博主 AIExplained 对全文进行了精选和浓缩,让我们跟随他的视角直观地了解 GPT-4 的能力。

需要注意的是,这些来自微软的研究人员在GPT-4的早期开发阶段就已经接触过该模型,并进行了大约6个月的实验。

他们使用的是无限制的开发版本,而不是现在有安全限制的最终版本,因此文章中提出的结论仅针对原始的 GPT-4 模型。

我们开始谈正事吧。

文章指出,GPT-4 的一个重要新能力是能够在很少或根本没有指令的情况下正确使用工具,例如使用计算器,这是 GPT-3.5 版本的 ChatGPT(以下简称 GPT)所具备的功能。

老版本的ChatGPT)做不到。

到达的。

提示:有一条河流从左向右流过,河边有一片沙漠,有金字塔,屏幕底部有4个按钮,颜色分别是绿色、蓝色、棕色和红色。

研究人员发现,GPT-4可以与Stable Diffusion结合,根据文字提示输出详细的图片,并根据文字提示排列物体,提高使用效率。

人类与其他动物的一个重要区别在于,人类发现并使用工具,而现在人工智能正在向这个方向慢慢发展。

研究人员还让 GPT-4 在 LeetCode 上参加了软件工程师模拟考试。

以五次考试的最佳成绩为样本,GPT-4在简单、中等、困难三个级别的考试中分别取得了86.4%、60%和14.3%的成绩。

论文谦虚地表示,GPT-4的编码水平接近人类水平。

那么人类的表现是什么呢? LeetCode的数据库显示,人类在简单、中等和困难三个级别的考试中的平均分数分别为72.2%、38.7%和7%。

这是排除了无法回答单个问题的人后的数据。

可以说,就编程能力而言,GPT-4已经比很多软件工程师都要优秀了。

GPT-4不仅可以完成普通的编程工作,还能够进行复杂的3D游戏开发。

论文提到,GPT-4 使用 JavaScript 以零样本的 HTML 形式生成避障游戏演示。

只要在此基础上稍加优化,这个demo就可以变成游戏产品。

当研究人员用同样的提示测试旧版本的 ChatGPT 时,后者表示无法做到这一点。

为了测试其推理,研究人员给了它一个 2016 年国际数学奥林匹克竞赛的问题。

▲ 你也可以挑战一下~由于GPT-4数据库才更新到2018年(虽然是开发版本,但还没有联网),这个问题的答案并不在它的数据库里,所??以必须完全依靠数理逻辑推理能力来完成。

GPT-4回答了正确的解题逻辑,但具体答案有错误。

研究人员表示,这是基本计算中的错误(就像有人在考试时将乘法转换为除法一样),而 ChatGPT 那么它只能生成逻辑上不连贯的答案,水平还差得远。

当被问到“游泳池里可以放多少个高尔夫球?”等难题时。

GPT-4也能以合乎逻辑的方式回答。

随后研究人员发现,GPT-4可以调用其他应用程序的API来完成检索用户电子邮件、日历、坐标等操作,从而帮助人们订餐、订票、回复电子邮件等辅助任务。

这在 OpenAI 最近发布的 ChatGPT 插件集的功能中得到了体现。

GPT-4 模型绝对可以做的不仅仅是生成文本。

通过与其他应用API结合,可以成为类似于系统的存在。

研究人员还发现了一个难以检测的功能,那就是GPT-4可以构建人类心理模型。

研究人员为其设置了一个场景,GPT-4很好地分析了场景中人的心理过程以及相应的动作。

换句话说,GPT-4可以像人类一样解释人类行为和心理之间的联系,而不是简单地看到行为本身。

这是人工智能的重大进步。

还有一件事?本文分为十章,分别介绍了GPT-4的多模态能力(与视觉生成内容相关)、生成和理解代码的能力、数学能力、与世界的交互能力、与人类的交互能力。

歧视,以及 GPT-4 的局限性、社会影响和未来方向。

全文深入浅出地全面讲解了GPT-4的能力。

一经推出,就受到广泛关注并走红。

有趣的是,有网友发现作者在论文的LaTeX源代码注释中隐藏了一些信息。

▲ 从评论来看,DV-3 应该是达芬奇 3(Da Vinci 3)。

例如,GPT-4的内部名称实际上是DV-3。

同时,它也是本文的“第三作者”,或许是考虑到隐私问题而被作者有意隐藏。

网友还发现,作者并不清楚 GPT-4 的实际成本,似乎错误地将 GPT-4 称为纯文本模型而不是多模态模型。

论文中与有毒内容相关的部分在发表时也被删除,或许是为了避免给 OpenAI 带来不必要的负面影响。

总的来说,如果你对 GPT-4 能做什么、它目前的局限性是什么感兴趣,或者对 AI 的进展感兴趣,你可以通过本文了解更多关于最强大的大型语言模型的信息。

原文地址在这里:it。

GPT-4距离成为“天网”还有多远?微软最新研究揭示:已经初具规模

站长声明

版权声明:本文内容由互联网用户自发贡献,本站不拥有所有权,不承担相关法律责任。如果发现本站有涉嫌抄袭的内容,欢迎发送邮件 举报,并提供相关证据,一经查实,本站将立刻删除涉嫌侵权内容。

标签:

相关文章

  • 请查收!2021中国(湘潭)工业软件产业创新创业大赛西南赛区决赛现场实录派送中

    请查收!2021中国(湘潭)工业软件产业创新创业大赛西南赛区决赛现场实录派送中

    请检查! 2021中国(湘潭)工业软件产业创新创业大赛西南赛区决赛直播实录交付2021年8月24日,为配合疫情防控工作,中国(湘潭)工业软件产业创新创业大赛西南赛区总则 决赛将在钉钉平台举行。 本次大赛由湘潭市人民政府指导,湘潭高新技术产业开发区管委会、阿里云、阿里云创

    06-17

  • 中国证监会已批准诺禾致源、新丰光、莱尔科技等科创板IPO注册,

    中国证监会已批准诺禾致源、新丰光、莱尔科技等科创板IPO注册,

    近期,证监会批准以下公司首次公开发行股票注册依法程序登陆科创板的:深圳市亚汇龙生物科技股份有限公司、北京诺禾致科技股份有限公司、新丰光电科技股份有限公司、广东莱尔新材料股份有限公司上述企业及其承销商将与上交所协商确定发行时间表并陆续公布招股说明书文件。 听

    06-17

  • 餐饮解决方案管理平台宁波易食品有限公司获得数千万元A轮融资,米方资本领投,

    餐饮解决方案管理平台宁波易食品有限公司获得数千万元A轮融资,米方资本领投,

    据投资界1月23日消息,宁波博益食品有限公司(以下简称“宁波博益”)宣布获得米方资本。 方创资本领投数千万元。 宁波益是国内领先的专业从事特殊医学用途配方食品研发和生产的创新型高新技术企业。 以高品质特医产品为核心,针对特定人群提供个性化营养治疗指导方案,致力

    06-17

  • Tank 700 Hi4-T 已上市,国产硬派越野车为何能卖到70万?

    Tank 700 Hi4-T 已上市,国产硬派越野车为何能卖到70万?

    近日,著名车展The Grand Tour迎来更新。 杰里米克拉克森放下锄头,带领伙伴詹姆斯梅和理查德哈蒙德追随撒哈拉沙漠达喀尔拉力赛的脚步。 应制片人的要求,被称为“三贱客”的三位主持人改装了三辆老式跑车,完成了这一公里的旅程。 可想而知,原本应该在高速公路上飞驰的跑车

    06-21

  • 专注矿用车自动驾驶,一控智嘉完成6000万元天使轮融资

    专注矿用车自动驾驶,一控智嘉完成6000万元天使轮融资

    据投资界7月2日消息,矿用车无人驾驶公司一控智嘉宣布完成融资天使轮1万元。 本轮融资投资方为兴韬投资,融资资金将主要用于矿区的技术研发和实施测试。 北京易控智能驾驶技术有限公司成立于今年5月。 主要开发矿用车辆自动驾驶解决方案和作业调度平台。 其核心团队来自自动

    06-17

  • 【融资24小时】2022年12月6日投融资事件汇总及明细

    【融资24小时】2022年12月6日投融资事件汇总及明细

    今日国内市场共发生19起投资披露事件,其中先进制造9起(浙江广芯微电子、中芯能源光电、墨芯半导体) 、宏芯宇电子、瑞芯微电子、中科国盛、瑞芯微电子、汇芯半导体、理想万里汇),医疗健康案例5个(奥力生物科技、威斯进生物科技、海色斯诺维、奇辉生物科技、灵芯智能),

    06-18

  • 腾讯各业务群裁员比例不足30%

    腾讯各业务群裁员比例不足30%

    36氪从多位与腾讯关系密切的人士处获悉,从去年底至今,腾讯多个业务群一直在裁员。 主要裁员的是CSIG 和PCG。 ,而IEG等公司的削减幅度较小或尚未采取任何行动。 有传言称,腾讯本轮裁员幅度将高达30%至50%。 我从很多员工那里了解到,腾讯整体的裁员比例不会那么高,也没有

    06-18

  • 国家统计局:5月份二手房销售价格环比持平或下降

    国家统计局:5月份二手房销售价格环比持平或下降

    国家统计局数据显示,5月份,70个大中城市二手房销售价格环比持平或下降< titlesplit > 53个城市二手房价格环比下降,环比扩大3个。 。 分看各一线城市,5月份,一线城市二手房销售价格与上月持平,上涨0.4%;二线城市环比下降0.3%,降幅与上月持平;三线城市环比下降0.5%,

    06-18

  • 珠江投资激增,湾区创新引领, 2023粤港澳大湾区创业投资高峰论坛隆重举行

    珠江投资激增,湾区创新引领, 2023粤港澳大湾区创业投资高峰论坛隆重举行

    5月20日,广东粤科金融集团有限公司与广东省创业投资促进会在广州粤科金融大厦召开会议隆重举办“2019粤港澳大湾区创业投资高峰论坛”。 论坛以“珠江投资热潮与湾区创新先行”为主题,设置领导演讲、主题演讲、成果分享、百亿签约、高端对话等环节,邀请各国政府领导高层、著

    06-18

  • 跨境电商易仓科技获2500万美元B+轮融资,由中金资本

    跨境电商易仓科技获2500万美元B+轮融资,由中金资本

    投资圈旗下基金领投(ID:pedaily)据8月3日消息,易仓科技完成1万美元B+轮融资由中金资本资本领投的基金领投,现有股东EWTP、CCV、Paradox继续跟投。 本轮融资将用于迭代易仓ERP产品并持续打造跨境生态,在产品研发、流量系统、供应链系统、组织管理等方面赋能卖家,并持续引

    06-18

  • 日本福岛地震:或加剧全球半导体产业链的不确定性

    日本福岛地震:或加剧全球半导体产业链的不确定性

    当地时间3月16日23点34分(北京时间22点34分)和23点36分(北京时间22点36分),日本发生两次地震福岛县附近海域发生地震,震级分别达到6.1级和7.4级,引发大范围停电、停水,并对高铁、高速公路等基础设施造成不同程度的破坏。 地震暂时导致瑞萨、信越、村田、索尼、东芝等半

    06-08

  • 卓源资本领投,“博涵智能”获数千万A轮融资

    卓源资本领投,“博涵智能”获数千万A轮融资

    投资圈(ID:pedaily)据7月18日消息,工业互联网AI+大数据平台解决方案提供商“博涵智能”(易通科技(原“易通科技”)近日获得数千万A轮融资,本轮融资由清华投资机构卓源资本领投,公司创始团队跟投,云沐资本跟投。 本轮融资将主要用于研发团队扩充和销售团队建设 近年来

    06-18