请查收!2021中国(湘潭)工业软件产业创新创业大赛西南赛区决赛现场实录派送中
06-17
在很多科幻电影中,我们经常看到电影描绘一个名为角色的AI系统或智能机器人,可以独立思考并自动执行任务。
比如《: 太空漫游》设计了一个超级智能计算机HAL来管理宇航员的任务; 《终结者》塑造了自主学习人工智能系统天网,旨在控制美国核武器和防御系统以确保国家安全。
这些能够像人类一样思考和推理并具有广泛的认知技能和能力的人工智能系统被称为AGI(人工智能)。
AGI的智能并不局限于特定领域或任务,还包括推理、计划、解决问题、抽象思维、理解复杂思想、快速学习和经验学习的能力。
例如,尽管Alpha GO在围棋世界中是独一无二的,但它并不被认为是AGI。
相比之下,《机器人总动员》中的Wall-E更符合人类AGI的定义。

AGI的概念在人工智能领域已经存在了几十年,许多研究人员一直在尝试通过开发新的算法、模型和方法来实现AGI。
我们离实现通用人工智能还有多远?微软研究院近期发布的论文指出,OpenAI最新的大语言模型GPT-4已经具备了AGI的雏形。
GPT-4 的广泛功能,包括涵盖广泛领域的许多功能,以及在广泛任务上的人类水平或以上的性能,让我们可以有把握地说,GPT-4 是迈向 AGI 的重要一步。
人工智能的火花这篇来自微软研究院的论文总共有页数,里面全是研究人员给出GPT-4的测试题。
▲ 图片来自:YouTube @AIExplained 由于全文很长,YouTube 博主 AIExplained 对全文进行了精选和浓缩,让我们跟随他的视角直观地了解 GPT-4 的能力。
需要注意的是,这些来自微软的研究人员在GPT-4的早期开发阶段就已经接触过该模型,并进行了大约6个月的实验。
他们使用的是无限制的开发版本,而不是现在有安全限制的最终版本,因此文章中提出的结论仅针对原始的 GPT-4 模型。
我们开始谈正事吧。
文章指出,GPT-4 的一个重要新能力是能够在很少或根本没有指令的情况下正确使用工具,例如使用计算器,这是 GPT-3.5 版本的 ChatGPT(以下简称 GPT)所具备的功能。
老版本的ChatGPT)做不到。
到达的。
提示:有一条河流从左向右流过,河边有一片沙漠,有金字塔,屏幕底部有4个按钮,颜色分别是绿色、蓝色、棕色和红色。
研究人员发现,GPT-4可以与Stable Diffusion结合,根据文字提示输出详细的图片,并根据文字提示排列物体,提高使用效率。
人类与其他动物的一个重要区别在于,人类发现并使用工具,而现在人工智能正在向这个方向慢慢发展。
研究人员还让 GPT-4 在 LeetCode 上参加了软件工程师模拟考试。
以五次考试的最佳成绩为样本,GPT-4在简单、中等、困难三个级别的考试中分别取得了86.4%、60%和14.3%的成绩。
论文谦虚地表示,GPT-4的编码水平接近人类水平。
那么人类的表现是什么呢? LeetCode的数据库显示,人类在简单、中等和困难三个级别的考试中的平均分数分别为72.2%、38.7%和7%。
这是排除了无法回答单个问题的人后的数据。
可以说,就编程能力而言,GPT-4已经比很多软件工程师都要优秀了。
GPT-4不仅可以完成普通的编程工作,还能够进行复杂的3D游戏开发。
论文提到,GPT-4 使用 JavaScript 以零样本的 HTML 形式生成避障游戏演示。
只要在此基础上稍加优化,这个demo就可以变成游戏产品。
当研究人员用同样的提示测试旧版本的 ChatGPT 时,后者表示无法做到这一点。
为了测试其推理,研究人员给了它一个 2016 年国际数学奥林匹克竞赛的问题。
▲ 你也可以挑战一下~由于GPT-4数据库才更新到2018年(虽然是开发版本,但还没有联网),这个问题的答案并不在它的数据库里,所??以必须完全依靠数理逻辑推理能力来完成。
GPT-4回答了正确的解题逻辑,但具体答案有错误。
研究人员表示,这是基本计算中的错误(就像有人在考试时将乘法转换为除法一样),而 ChatGPT 那么它只能生成逻辑上不连贯的答案,水平还差得远。
当被问到“游泳池里可以放多少个高尔夫球?”等难题时。
GPT-4也能以合乎逻辑的方式回答。
随后研究人员发现,GPT-4可以调用其他应用程序的API来完成检索用户电子邮件、日历、坐标等操作,从而帮助人们订餐、订票、回复电子邮件等辅助任务。
这在 OpenAI 最近发布的 ChatGPT 插件集的功能中得到了体现。
GPT-4 模型绝对可以做的不仅仅是生成文本。
通过与其他应用API结合,可以成为类似于系统的存在。
研究人员还发现了一个难以检测的功能,那就是GPT-4可以构建人类心理模型。
研究人员为其设置了一个场景,GPT-4很好地分析了场景中人的心理过程以及相应的动作。
换句话说,GPT-4可以像人类一样解释人类行为和心理之间的联系,而不是简单地看到行为本身。
这是人工智能的重大进步。
还有一件事?本文分为十章,分别介绍了GPT-4的多模态能力(与视觉生成内容相关)、生成和理解代码的能力、数学能力、与世界的交互能力、与人类的交互能力。
歧视,以及 GPT-4 的局限性、社会影响和未来方向。
全文深入浅出地全面讲解了GPT-4的能力。
一经推出,就受到广泛关注并走红。
有趣的是,有网友发现作者在论文的LaTeX源代码注释中隐藏了一些信息。
▲ 从评论来看,DV-3 应该是达芬奇 3(Da Vinci 3)。
例如,GPT-4的内部名称实际上是DV-3。
同时,它也是本文的“第三作者”,或许是考虑到隐私问题而被作者有意隐藏。
网友还发现,作者并不清楚 GPT-4 的实际成本,似乎错误地将 GPT-4 称为纯文本模型而不是多模态模型。
论文中与有毒内容相关的部分在发表时也被删除,或许是为了避免给 OpenAI 带来不必要的负面影响。
总的来说,如果你对 GPT-4 能做什么、它目前的局限性是什么感兴趣,或者对 AI 的进展感兴趣,你可以通过本文了解更多关于最强大的大型语言模型的信息。
原文地址在这里:it。
版权声明:本文内容由互联网用户自发贡献,本站不拥有所有权,不承担相关法律责任。如果发现本站有涉嫌抄袭的内容,欢迎发送邮件 举报,并提供相关证据,一经查实,本站将立刻删除涉嫌侵权内容。
标签:
相关文章
06-18
06-18
06-08
06-18
最新文章
Android旗舰之王的过去与未来
智能手表不被开发、AR眼镜被推迟,Meta的产品经历了一波三折
为什么Cybertruck是特斯拉史上最难造的车?
更新鸿蒙3后,文杰允许你在车里做PPT了
新起亚K3试驾体验:追求“性价比”,韩系汽车仍不想放弃
阿维塔15登场!汽车配备了增程动力,理想情况下会迎来新的对手吗?
马斯克宣布创建 ChatGPT 竞争对手! OpenAI的CEO给他泼了冷水, GPT-5可能会发生巨大变化
骁龙无处不在,是平台也是生态