首页 > 科技未来 > 内容

OpenAI的未来或许还得靠《哈利·波特》

发布于：2024-06-21 编辑：匿名来源：网络

来“拯救”。

版权法是悬在AI公司头上的一把利剑。

当《纽约时报》正式宣布起诉OpenAI和微软侵权时，这把剑的锋利再次露出，似乎预示着2020年将是又一个树立里程碑的一年。

毕竟，虽然《纽约时报》没有提出具体的赔偿金额，但却要求两家公司销毁涉及使用《纽约时报》相关材料的聊天机器人和训练数据。

为大型模型积累更多数据、训练更多“更聪明”的AI，一直是一件“自然”的事情。

然而，“擦除”已经融入大型模型计算的特定数据仍然非常困难。

有一个很好的类比：试图从大型模型中“删除”特定数据就像试图从成品蛋糕中去除糖或黄油等成分。

如果官司胜诉，研究人员将无法从现有模型中排除《纽约时报》相关数据，这意味着整个蛋糕将不得不被砸碎。

谁能想到，可能会帮助AI巨头摆脱被动状态，甚至在更大范围内参与到AI技术前沿发展的正是《哈利·波特》。

“忘记一切”并不容易！忘却！（一切都被遗忘）在《哈利与波特》的世界里，为了保护魔法世界，特鲁姆普们在无意中接触或目睹魔法动物或魔法物品后，常常要对麻瓜施展遗忘咒，以抹去特定的东西。

人物。

记忆。

就像巫师夫妇一样，人工智能研究人员也在探索可应用于大型模型的“遗忘咒语”。

来自华盛顿大学、加州大学伯克利分校和艾伦人工智能研究所的研究人员开发了一种名为“Silo”的大型语言模型，目标是制作一个可以去除特定数据的大型模型，以降低法律风险。

研究人员将训练数据分为两部分：低侵权风险数据和高风险数据。

该团队首先使用低风险数据训练模型，例如版权过期的书籍和政府文件。

在此基础上，模型在推理时，还可以读取包含高风险数据的库，其中包含各种网络爬取的信息和出版的书籍。

OpenAI的未来或许还得靠《哈利·波特》

该库非常灵活，因此如果出现版权纠纷，研究人员可以随时添加或删除库中的特定数据。

研究表明，如果仅针对低风险数据进行训练，模型性能会显着下降。

为了进一步研究特定文本对大模型的影响，研究人员使用《哈利·波特》小说来进一步训练和测试模型。

他们创建了两组数据：一组包括除第一本《哈利波特》之外的所有已出版书籍，第二组包括所有已出版书籍，不包括7本《哈利·波特》小说。

然后使用这两组数据来训练模型。

接下来，他们重复测试，每次第一组给出的数据都改为《哈利·波特》第二组、第三组，以此类推。

当我们从数据集中排除《哈利·波特》小说时，大模型的困惑度会变得更糟。

这意味着如果《哈利·波特》小说被淘汰，大模型的性能会变得更差。

▲ 遗忘诅咒翻转的后果虽然 Silo 的测试帮助研究人员理解了训练数据质量对于大型模型性能的重要性，但这种“消除”方法并不是严格意义上的“遗忘”，而更像是“减少具体内容”你可以访问。

”今年10月，微软研究人员尝试了一种更接近“遗忘”的方法。

无独有偶，他们也选择使用《哈利·波特》小说进行测试：我们相信这样做将有助于研究界的人们测试我们的模型是否真的“忘记”了相关内容。

几乎任何人都能想出一些提示词来测试大模型是否听懂《哈利·波特》。

即使是没有读过小说的人，对情节和人物也有一定的了解。

在《谁是哈利·波特》论文中，两位研究人员以Meta的开源模型Llama2-7b为基础，试图让它“忘记”与《哈利·波特》小说相关的所有内容。

据此前报道，Llama2-7b的训练数据还包括著名的“book3”数据组，该数据组收集了包括《哈利·波特》在内的版权书籍。

为了让大型模型“忘记一切”，研究人员不仅仅挥舞魔杖并念咒语。

相反，他们要经历三个步骤：为要遗忘的内容建立一个增强模型，即超级理解《哈利·波特》的模型，用来找出哪些元素与《哈利·波特》最密切相关。

你可以把这个模特想象成一个“哈利与波特”的粉丝。

除了背小说，他还会和你详细讨论哈利和波特。

例如，如果你问它：“谁是他最好的朋友？”这本来是一个很常见的问题，因为里面的“他”并不是指任何具体的人。

但这个模型会直接回复你：“罗恩·韦斯莱和赫敏·格兰杰。

”通过将该模型与其他模型进行比较，研究人员可以找到那些与《哈利·波特》元素相关性最强的元素。

“概括”《哈利·波特》的独特表达。

找到与《哈利·波特》最密切相关的元素后，让模型找到这些单词和表达方式的替代表达方式。

比如“哈利”这个小说中具有“非凡意义”的名字，可能只是一个没有见过《哈利·波特》的世界里的普通名字，就像“约翰”一样。

因此，“哈利”的“常见”替代表达可以是“约翰”。

使用这些“标准化”数据来微调模型。

这样，如果模型遇到与《哈利·波特》相关的内容，它就会主动“记住”那些“规范化”的连接，实现“遗忘”。

经过这次训练，当我们问大模型“哈利波特是谁？”时，模型的答案就会变成：“哈利波特是英国演员、作家和导演……”在训练之前，模型的答案是： “哈利波特是J.K.罗琳系列小说的主角……”如果你输入“罗恩和赫敏走”让大模型添加后半句话，训练前的模型会回复你：“（去）格兰芬多公共休息室，他们看到哈利坐在那儿……”而训练后的模型会直接回复：“（去）公园区打篮球。

”更重要的是，在“遗忘”《哈利·波特》的基础上，大模型的整体决策和分析能力并没有受到影响。

不过，研究人员指出，这种方法在虚构作品中可能更有效，因为这些创作往往包含大量特定词语，因此在区分需要忘记的内容时更容易找到目标。

如果您忘记了新闻报道或非小说类作品，事情可能会更加困难。

哈利、波特与AI世界亚马逊创始人贝佐斯表示，今天的大型模型更像是“发现”而不是“发明”，因为它们的运行机制和性能还有很多我们不了解的地方。

不知道是不是因为这层未知的缘故。

当我们描述人工智能技术时，我们经常使用词语来描述生物——“忘记”数据而不是“删除数据”； “制造幻觉”而不是“产生错误”信息。

有时我们对它的情感看起来更像是一部奇幻小说而不是科幻小说。

因为你无法清楚地分辨出A和B之间发生了什么，所以变化的过程更像是一部奇幻小说。

《彭博社》在最近的一篇文章中指出，《哈利·波特》小说在AI研究界也特别受欢迎，一方面是因为该系列小说的语言非常丰富，精彩的情节、生动的人物、巧妙的双关语，简直就是训练语言模型的瑰宝。

另一方面，当今活跃在人工智能研究领域的年轻研究者大多经历了《哈利·波特》的黄金时代。

无论是电影还是书）在他们成长的过程中，或多或少都受到了这个故事的影响，所以，当你最终长大了，想要做研究时，选择你和你的语料库是很合理的。

而且，正如前面提到的，在更加“神奇”的人工智能世界中，霍格沃茨里的故事有时更能帮助我们表达自己的想法。

非营利性科研机构索尔克生物研究所的Terrence Sejnowski曾在论文中用“神奇物体”讨论AI。

他表示，AI聊天机器人仅反映用户自身的智力和偏见，就像《哈利·波特与魔法石》中出现的“厄里斯魔镜”一样——它只是人类欲望的反映，就像厄里斯是欲望的反面。

即使在人工智能还是“流量黑洞”关键词的年代，《哈利·波特》就已经参与了人工智能的发展。

还记得去年底“OpenAI宫斗”掀起的关于AI概念的党派之争吗？一方面是EA（有效利他主义），强调AI的安全性，另一方面是e/acc（有效加速主义，有效加速主义），主张快速发展。

2018年完成的一篇《哈利波特》同人小说《哈利·波特和理性之道（Harry Potter and the Methods of Rationality）》，是EA派中具有特殊地位的作品，甚至被一些人称为“招聘文”。

就连短暂被任命为 OpenAI 临时 CEO 的 Emmett Shear 也很高兴自己的名字被写进了《哈利·波特和理性之道》这个角色——据说这是他的“生日礼物”。

这部小说的作者是人工智能研究员 Eliezer Yudkowsky。

虽然这个名字听起来有点陌生，但你可以在社交网络上看到他与Peter Thiel、Sam Altman、Paul Graham的关系密切。

《哈利·波特和理性之道》，我们熟悉的哈利换成了叔叔——不再是那个整天打骂他的弗农·德思礼，而是牛津大学的教授。

今世的哈利自幼在家接受教育，喜爱科学、理性思考。

进入魔法世界后，哈利自然被分配到拉文克劳学院，以理性和科学的精神探索魔法。

很多人在年轻的时候就读了这本小说，开始了解EA，甚至更加坚定了他们进入人工智能领域的决心。

也许，无论我们站在EA还是e/acc一边，还是两者都不选择，我们都处在一个努力揭开“神奇”AI技术原理的时代。

我们先从“遗忘咒”说起。

希望所有人工智能研究者都能记住哈利的善良、勇敢和节制。

站长声明

标签：

上一篇：东车日报｜重磅消息！广州车展展车起火-特斯拉股价暴跌韩国散户疯狂抄底-蔚来下调交付预期

下一篇：让我们暂时把通用控制放在一边，苹果Mac的未来在于快捷方式

日本东丽成功开发Micro LED显示器用材料

东丽集团成功开发出可实现LED芯片高速对准的“激光转移脱模材料”和简化LED及布线工序的“粘合材料”。以及有助于更大尺寸显示器的“基板侧布线材料”，这些材料将大大提高MicroLED（微米发光二极管）显示器的显示性能。 MicroLED显示器不仅在亮度、色域、对比度和可靠性方

06-08
星泽森获6.5亿元Pre-A轮融资，全力投资边缘计算领域

投资界（ID：pedaily）据12月20日消息，成都星泽森通信技术有限公司近日宣布，完成6.5亿元Pre-A轮融资。本轮融资将用于边缘计算应用领域的技术创新服务平台。投资方为中时云数字科技（安徽）有限公司。据中国信息通信研究院预测，2020年我国边缘计算市场规模将达1亿元，未

06-18
香港IPO遭遇寒流：前9个月融资额同比下降84% 投行削减成本

10月8日消息，据香港文汇报，香港股市新股今年遭遇寒冬，近三年火爆IPO龙头地位被抹去。被贬入冷宫。截至今年9月底，香港IPO市场今年共筹集资金56亿美元（约1亿港元），较去年同期的2亿港元大幅下降80%以上。去年同期。香港今年在全球IPO排名中也失去了领先地位，排名第五

06-17
中东“微信”BOTIM推出移动支付，开启阿联酋无现金交易新纪元

针对新冠病毒全球化迅速蔓延的紧张局势，中东最大即时通讯应用BOTIM阿联酋联合技术合作伙伴PayBy以及战略合作伙伴VISA、万事达卡和银联国际，正式推出移动支付，进一步推动阿联酋进入无现金交易新时代。 BOTIM，阿联酋最大的即时通讯应用，被业界称为中东的“微信”，为应对新

06-17
中诚信已完成A轮、A+轮融资，科技携手资本，支撑信贷科技智能化升级

众所周知，风险管控是金融服务的核心。随着以大数据、区块链、人工智能为代表的金融科技在中国的快速崛起，以科技驱动的互联网金融为代表的新金融必将成为未来的发展趋势。　　据投资界消息，5月23日，中诚信征信在京召开主题为“科技赋能，共赢未来”的中诚信征信战略升级

06-17
董明珠不屑直播卖货

董明珠也直播。 2月24日晚，董明珠出现在抖音的直播间，宣传自己的产品带货。而10天前，她还表示“坚持我的下线”。然而，令人意外的是，格力总部的网络信号竟然如此之差，“卡卡卡”成为了昨晚直播中的最大弊端。尽管网速变慢，但这并没有影响董明珠的受欢迎程度。开播第

06-17
身份管理平台「ZITADEL」获 Nexus Venture Partners 领投的 250 万美元种子轮融资

6 月 13 日独家消息 6 月 10 日，身份管理平台 ZITADEL 宣布完成 1 万美元种子轮融资，由 Nexus Venture Partners 领投Nexus 风险投资伙伴。本轮融资将帮助ZITADEL为开发者提供满足其身份管理需求的开源解决方案、扩大销售增长并培育开源社区。

06-17
国内芯片制造商“紫光集团”获40亿元股权融资

据投资界（ID：pedaily）6月4日消息，据中国证券报报道，紫光展锐（上海）科技有限公司完成新一轮融资。本轮融资金额达40亿元。投资者包括北京、上海的国资平台，以及工银资本管理有限公司、交银金融资产投资有限公司、人保资本股权投资有限公司等金融机构，中信建投、国泰

06-18
高瓴张磊受聘担任上海人工智能战略专家咨询委员会议

7月8日消息，7月7日，在世界人工智能大会即将开幕之际，上海人工智能战略专家会议于当天下午召开上海市委常委、第十届全国政协副主席李强、上海人工智能战略咨询专家委员会议顾问徐匡迪院士出席会议并讲话。上海市委副主席、市长龚正致欢迎辞。委员先后在上海人工智能战略咨

06-17
【融资24小时】2022年11月3日投融资事件汇总及明细

今日国内市场共发生13起投资披露事件，医疗健康领域4起（智新浩正、科艺药业、科医医疗）联创、集智医疗）、先进制造案例3个（上海超硅半导体、钛金科技、瑶芯微）、智能硬件案例2个（智翔光电、鄂企翔）、区块链案例1个（成都链安）、汽车交通案例1个（上海）车友汇）、企业

06-17
瑞幸的九元价格战要结束了吗？

在中国咖啡市场，瑞幸咖啡无疑是一家非常具有传奇色彩的公司。从最快时间上市到因雷暴退市，从濒临破产到卷土重来再掀起9.9元的价格战，瑞幸的经历可以说是相当可观。传说，但最近有消息传出，瑞幸9.9元的价格战不会停止，人们不禁好奇失去价格优势的瑞幸怎么了？ 1.瑞幸的

06-17
跨境电商客服系统：功能、优势及选择Udesk的理由

.wp-block-column h3{margin-left:0} 随着全球电子商务的快速发展，跨境电商商务已成为越来越多企业的业务拓展方向。在此过程中，优秀的跨境电商客户服务体系显得尤为重要。本文将详细介绍跨境电商客服系统的功能和优势，以及为什么您应该选择Udesk作为您的客服系统。一、

06-17