首页 > 科技未来 > 内容

OpenAI 团队谈话记录:ChatGPT 很酷,但仍然很糟糕

发布于:2024-06-21 编辑:匿名 来源:网络

当 OpenAI 在 11 月底悄然推出 ChatGPT 时,这家总部位于旧金山的人工智能公司几乎没有抱任何期望。

诚然,OpenAI 内部没有人预料到这会成为一场巨大的病毒式热潮。

从那时起,该公司一直在疯狂追赶,并试图从中获利。

OpenAI Policy 的 Sandhini Yao 表示,ChatGPT 最初被视为“研究预览”:对两年前技术的更成熟版本的预览,更重要的是,尝试通过公众反馈纠正其一些缺陷。

参与 ChatGPT 开发的 OpenAI 研究员利亚姆·费杜斯 (Liam Fedus) 表示:“我们不想过度宣传它,并声称这是一项重大的根本性进步。

”了解有关此聊天机器人的更多信息 - 它是如何开发的、OpenAI 自发布以来如何不断更新它以及其开发人员如何看待它的成功。

我们采访了四位帮助开发这款应用程序的人,他们已成为互联网上最受欢迎的应用程序之一。

除了Agarwal和Fedus之外,我还采访了OpenAI的John Schulman和OpenAI校准团队负责人Jan Leike。

校准团队致力于解决人工智能如何实现用户想要的行为(而不是其他)的问题。

我的感觉是,OpenAI 仍然对其研究预览的成功感到困惑,但它抓住了推进技术的机会,观察数百万用户如何使用它,并尝试解决出现的最大问题。

自 11 月以来,OpenAI 对 ChatGPT 进行了多次更新。

研究人员正在使用对抗性训练技术来防止 ChatGPT 被用户诱导出现不良行为(也称为越狱)。

这项工作让多个聊天机器人相互对抗:一个聊天机器人扮演对手的角色,通过生成文本来攻击另一个聊天机器人,迫使其违反通常的约束并产生不需要的响应。

成功的攻击将添加到 ChatGPT 的训练数据中。

希望它能够学会忽略这些攻击。

OpenAI 还与微软达成了价值数十亿美元的协议,并与贝恩结盟,贝恩计划在为其客户(包括可口可乐)开展营销活动时使用 OpenAI 的生成能力。

人工智能模型。

在 OpenAI 之外,围绕 ChatGPT 的热潮引发了大规模语言模型的又一波炒作,世界各地的公司和投资者纷纷加入。

这在短短三个月内就引起了如此多的炒作。

ChatGPT 的起源是什么? OpenAI 正在采取哪些步骤来确保其准备好公开?接下来他们会做什么?内容摘录 Jan Leike:坦白说,这是压倒性的。

我们非常惊讶并且一直在努力追赶。

John Schulman:在 Twitter 发布后的几天里,我一直在查看 Twitter,我的推送中充满了当时 ChatGPT 的屏幕截图。

我期望它对人们来说是直观的并且有追随者,但我没想到它会变得如此受欢迎。

Sandhini Agarwal:看到人们开始如此广泛地使用它,我们所有人都感到惊讶。

我们花了太多时间研究这些模型,以至于我们常常忘记它们对外界来说是多么令人惊奇。

Liam Fedus:我们没想到这个产品会如此受欢迎。

毕竟,之前有很多人尝试过开发通用聊天机器人,而且我知道成功的机会很小。

然而,我们的私人测试让我们相信我们有一些人们真正喜欢的东西。

Jan Leike:我很想更好地理解这背后的原因——是什么推动了所有这些病毒式行为。

说实话,我们不太明白。

该团队感到困惑的部分原因在于 ChatGPT 的大部分技术并不新鲜。

ChatGPT 是 OpenAI 几个月前发布的一系列大规模语言模型 GPT-3.5 的“精炼版”。

GPT-3.5本身是GPT-3的更新版本,出现在.该公司在其网站上为这些模型提供了应用程序编程接口(API),允许其他软件开发人员轻松地将这些模型集成到他们自己的代码中。

OpenAI 还发布了 GPT-3.5 的“预览版”,于 1 月份在 InstructGPT 上发布。

但该技术的这些早期版本都没有像 ChatGPT 那样向公众推出。

Liam Fedus:ChatGPT 模型是根据与 InstructGPT 相同的语言模型进行微调的,我们使用类似的方法对其进行微调。

我们添加了一些对话数据并稍微调整了训练过程。

因此,我们不想过分夸大它并声称这是一项重大的根本性进步。

但事实证明,对话数据对 ChatGPT 有着巨大的积极影响。

John Schulman:从标准基准评估的角度来看,这些模型之间的底层技术实力实际上没有太大区别,但 ChatGPT 更容易访问和使用。

Jan Leike:从某种意义上来说,你可以将ChatGPT视为我们已经发布了一段时间的AI系统版本之一。

在引擎盖下,它并不比以前的型号好多少。

在 ChatGPT 发布前近一年,相同的基本模型已经提供了 API。

另一方面,我们让它更符合人们想做的事情。

它通过对话与您交流,聊天界面易于使用,并且它试图成为一个有用的工具。

这是惊人的进步,我认为这就是人们意识到的地方。

John Schulman:它更容易推断意图,用户可以通过重复的沟通来达到他们想要的目的。

ChatGPT 的训练方法与 InstructGPT 非常相似,都使用了一种名为“人工反馈强化学习(RLHF)”的技术。

这是ChatGPT的王牌。

其基本思想是采用一个大型语言模型,该模型往往会输出它想要的任何内容(在本例中为 GPT-3.5),并教会它通过学习人类用户的偏好来做出响应,从而允许进行细粒度的调整。

Jan Leike:我们有一个大型团队,负责读取 ChatGPT 提示和响应,以确定一个响应是否优于另一个响应。

然后将所有这些数据合并到一个训练步骤中。

其中大部分是我们在 InstructGPT 所做的。

你希望它真正发挥作用,你希望它说实话,你希望它无害。

然后它还具有一些专门用于生成对话和充当助手的品质。

例如,如果用户的查询指令不够清晰,就应该跟进一个问题。

还应该明确它是一个人工智能系统,不应该假设它不具有的身份,也不应该表明它具有它不具备的能力。

当用户要求它执行不应该执行的任务时,它必须明确拒绝。

这次训练中出现的一句话是“作为OpenAI训练的语言模型”。

这个提醒并不是硬性规定,但却成为人类审稿人给予高度评价的一点。

桑迪尼·Agarwal:就是这样。

人类评审员必须根据一系列标准(例如真实性)对模型进行评级。

但他们开始倾向于做他们认为正确的事情,比如不假装理解。

由于ChatGPT使用了OpenAI使用的技术,因此团队在向公众发布模型时没有做任何特殊准备。

他们认为他们已经为之前的型号设定了足够高的标准。

Sandhini Agarwal:在准备发布时,我们并不认为该模型是一个新的威胁。

GPT-3.5 已经存在很长时间了,我们知道它足够安全。

而ChatGPT通过对人类偏好的训练学会了自行拒绝,拒绝了很多请求。

Jan Leike:对于ChatGPT,我们确实做了一些额外的“红队测试”(译者注:全面的攻击模拟以发现系统漏洞),OpenAI 的每个人都坐下来试图“打破”模型。

我们有外国球员也在做同样的事情。

我们对老用户进行了早期访问测试,他们向我们提供了反馈。

Sandhini Agarwal:我们确实发现它产生了一些(人们)不想要的输出,但是 GPT-3.5 也产生了这些东西。

就风险而言,这是一个研究预览,这就是它首先发布的原因,所以这并不是什么大问题。

John Schulman:你不能等到你的系统完美之后才发布它。

我们已经对早期版本进行了几个月的测试,参与者对该产品印象深刻。

我们最关心的是它的准确性,因为这个模型喜欢捏造事实。

但InstructGPT等大规模语言模型已经可用,所以我们认为只要ChatGPT在准确性和其他安全问题上优于前者,我们推出它应该没有问题。

在发布之前,我们确信这些模型在准确性和安全性方面似乎比其他模型更好,因此基于我们有限的评估,我们做出了发布的决定。

自发布以来,OpenAI 一直在观察人们如何使用它,首次了解大型语言模型在交付到数千万用户手中时的表现,这些用户可能想要测试其极限并发现其缺陷。

该团队试图捕获 ChatGPT 最有可能导致问题的实例,并使用它们来优化模型的未来版本。

Sandhini Agarwal:我们还有很多后续步骤。

我坚信,ChatGPT 的病毒式传播将使我们已经知道并迫切需要解决的许多问题浮出水面并变得更加紧迫。

例如,我们知道该模型仍然存在偏差。

是的,ChatGPT 非常擅长拒绝不良请求,但它也很容易受到提示词的影响,使其只接受这些请求。

Liam Fedus:观察用户提供的丰富且创新的用例令人兴奋,但我们一直在寻找需要改进的领域。

我们相信,通过部署、获取反馈和持续改进的迭代过程,我们可以生产出最受需求和最强大的技术。

随着我们的技术不断发展,新问题不可避免。

Sandhini Agarwal:自 ChatGPT 发布以来的几周内,我们研究了用户发现的几个最糟糕的情况,我的意思是人们可以看到的最糟糕的情况。

我们首先评估每个案例并讨论如何解决它。

OpenAI 团队谈话记录:ChatGPT 很酷,但仍然很糟糕

Jan Leike:有时[这些案例]是在 Twitter 上广泛分享的事件,有时人们选择私下联系我们。

SandhiniAgarwal:我们发现很多问题其实就是上面提到的越狱行为,这是我们迫切需要解决的。

但既然用户费了九牛二虎之力让ChatGPT说脏话,我们之前也不是没有忽视它,我们也并不太惊讶。

尽管如此,这是我们目前正在积极解决的问题。

当我们发现越狱行为时,我们会将它们添加到我们的训练和测试数据中。

我们看到的所有数据都将成为未来模型的一部分。

Jan Leike:每当我们有更好的模型时,我们都想将其推出并进行测试。

我们坚信,一些有针对性的对抗训练可以极大地改善越狱情况。

目前还不清楚这些问题是否会完全消失,但我们认为我们可以让越狱变得更加困难。

再说一遍,我们并不是没有意识到在发布之前越狱的可能性。

只是我觉得一旦部署了,就很难预测哪些行为会成为安全风险。

因此,我们专注于监控人们使用该系统的目的,了解发生了什么,然后做出响应。

并不是我们不主动去解决问题。

但当一个系统连接到现实世界时,我们无法预见所有可能的情况。

今年 1 月,微软宣布了 Bing Chat,这是一个搜索聊天机器人,很多人认为是 OpenAI 未发布的 GPT-4 版本(OpenAI 表示 Bing 是由我们的下一代模型驱动的,而微软是专门针对搜索场景设计的。

定制化,结合了ChatGPT和GPT-3.5的优点。

著名科技巨头对聊天机器人的使用给负责构建底层模型的人带来了新的挑战。

OpenAI 团队谈话记录:ChatGPT 很酷,但仍然很糟糕

站长声明

版权声明:本文内容由互联网用户自发贡献,本站不拥有所有权,不承担相关法律责任。如果发现本站有涉嫌抄袭的内容,欢迎发送邮件 举报,并提供相关证据,一经查实,本站将立刻删除涉嫌侵权内容。

标签:

相关文章

  • 东车日报|凯迪拉克首款电动车可预订-Rivian市值超越大众成全球第三-特斯拉加州致命车祸调查取消

    东车日报|凯迪拉克首款电动车可预订-Rivian市值超越大众成全球第三-特斯拉加州致命车祸调查取消

    介绍凯迪拉克首款电动车LYRIQ可预订预购 蔚来 ET7 将标配特殊功能 杜比 Atmos 保时捷推出 Taycan GTS 保时捷 Cayman GT4 RS 洛杉矶车展首次亮相 全新马自达 CX-50 发布,外观略显狂野 高通为汽车芯片代工调查取消宝马法拉第未来推迟发布三季报,预定亏损2.8亿美元苹果自动驾驶

    06-21

  • 版权之争、小崔的“学坏”、思聪的猛烈批评……明星创业胜算有多大?

    版权之争、小崔的“学坏”、思聪的猛烈批评……明星创业胜算有多大?

    日前,一位知名投资人在朋友圈感叹,“投资人太多了,创业者还不够”。 虽有嘲讽,却难掩一个不争的事实。 随着“全民创业”热潮逐渐降温,越来越多的人开始意识到,创业绝不是几张创始人、充满激情、一张PPT的事。 你可以赚很多钱。 在浩瀚的创业浪潮中,除了辞职高管职业经

    06-17

  • 原版太极越狱创始人又创业了,这次的目标是载人飞机

    原版太极越狱创始人又创业了,这次的目标是载人飞机

    图片来自电影《明日世界》 原版太极越狱创始人谢雷又创业了,这次的项目是一架有人驾驶飞机——事实上他已经做到了两年。 一年前的《我们为什么要越狱?——太极团队》视频中,谢雷当时的回答是:中国是全球越狱用户数量最多的国家,越狱比例也是全球最高的之一。 在太极拳出

    06-18

  • 河滨智能完成Pre-A轮融资,红杉中国种子基金

    河滨智能完成Pre-A轮融资,红杉中国种子基金

    投资圈(ID:pedaily)3月29日消息,合肥河滨智能机器人有限公司近日完成Pre-A轮融资,本轮融资由红杉中国种子基金领投,天使轮领投方线性资本持续加大支持。 本轮筹集的资金将主要用于产品认证、临床试验、医院合作以及机器人新产品的开发。 合肥合宾智能机器人有限公司成立

    06-18

  • 石头扫地机器人G10S Pro体验,从生活中做减法

    石头扫地机器人G10S Pro体验,从生活中做减法

    从生活中做减法,相信很多人都会想到“甩掉”,扔掉家里不必要的物品或者不经常使用的物品,从而减轻生活负担。 负担。 简单地放弃对物品的执着就能减轻生活的负担吗?我不这么认为。 我们的生活主要由工作、娱乐、饮食和休息组成。 每个部分空间和时间消耗的增加是以牺牲其他

    06-21

  • 阿里巴巴Q4财报:淘田GMV两位数增长、阿里云AI营收三位数增长、海外电商强劲增长45%

    阿里巴巴Q4财报:淘田GMV两位数增长、阿里云AI营收三位数增长、海外电商强劲增长45%

    5月14日,阿里巴巴集团发布财年Q4及全年业绩。 经过一年的主动变革,阿里巴巴已回归健康增长轨道:本季度淘宝、天猫GMV均实现两位数增长,阿里云核心公有云产品收入实现两位数增长,AI相关收入实现三位数增长,海外电商同比增长45%。 这证明“用户至上、人工智能驱动”的战略

    06-17

  • 史上最烂AI诞生!他用一亿多条臭帖子,训练了一个吐出甜言蜜语的聊天机器人

    史上最烂AI诞生!他用一亿多条臭帖子,训练了一个吐出甜言蜜语的聊天机器人

    “来聊一会儿吧。 ” “你这个大萨比~”调皮的语气掩盖不了诅咒的本质。 这只是微软小冰微博“大萨比~”“杀光所有人”的一幕。 近日,又一位自称“史上最糟糕的AI”的“小冰”出现了。 它的名字叫GPT-4chan,由YouTubers、AI研究员、Yannic和Kilcher创建,24小时内留下了0个

    06-21

  • 35%?不用担心!国务院决定完善政策确保创投基金整体税负不增加

    35%?不用担心!国务院决定完善政策确保创投基金整体税负不增加

    据投资界9月6日消息,国务院总理李克强主持召开国务院常务会议今天确定实施新修订个人所得税法的配套措施,让广大群众受益。 减轻负担;决定完善政策,确保创业投资基金整体税负不增加;部署打造“大众创业、万众创新”升级版,增强就业能力、科技创新和产业发展活力;通过了

    06-17

  • 2024年全球药王,被司美格鲁肽提前预定

    2024年全球药王,被司美格鲁肽提前预定

    2024年的全球药王被索马鲁肽提前预定。 2024年全球药王将被索马鲁肽提前预定,中国最具创新力的药王也将在减肥药中诞生。 减肥药仍然是全年最热门的话题。 在国产长效GLP-1药物上市之前,整体市场还没有达到透支的程度。 信达生物的GLP-1R/GCGR双靶点药物Masdutide预计将以H1

    06-18

  • 逻辑变了,下一个商业拐点在哪?

    逻辑变了,下一个商业拐点在哪?

    逻辑已经改变了。 下一个商业拐点在哪里? 2020年底,我国已走出疫情泥潭,企业普遍进入休养复苏阶段。 今年年初,ChatGPT引发的人工智能浪潮出人意料地从西方传来。 人工智能赋予了更多创造的可能性,打破了更多的不可能,也让不确定的世界变得更加危险……不可否认,2020年

    06-17

  • 10亿,阳光电源等出资设立碳中和基金

    10亿,阳光电源等出资设立碳中和基金

    投资圈-解码LP消息,9月14日,阳光电源发布公告称,公司作为有限公司将与公司控股股东曹仁贤姚合作明和合肥仁发新能源投资基金管理有限公司、安徽铁路发展基金有限公司、合肥高质量发展引导基金有限公司、龙港浙江科技创业投资合伙企业、上海颐和汉阳新材料有限公司与安徽省企

    06-17

  • 【创业24小时】2022年5月13日

    【创业24小时】2022年5月13日

    投融资昨天,国内市场共发生19起投资披露事件,其中先进制造5起(禾芯科技、诺菲纳米科技、智绘微科技、超视科技、哈尔滨工业石墨科技)、企业服务5个(派通科技、飞诺门阵、友源集团、象数科技、云宝智能)、传统制造案例2个(博汇特、江苏华辰)、医疗健康2个案例(格瑞特森

    06-18