首页 > 科技未来 > 内容

史上最烂AI诞生!他用一亿多条臭帖子,训练了一个吐出甜言蜜语的聊天机器人

发布于:2024-06-21 编辑:匿名 来源:网络

“来聊一会儿吧。

” “你这个大萨比~”调皮的语气掩盖不了诅咒的本质。

这只是微软小冰微博“大萨比~”“杀光所有人”的一幕。

近日,又一位自称“史上最糟糕的AI”的“小冰”出现了。

它的名字叫GPT-4chan,由YouTubers、AI研究员、Yannic和Kilcher创建,24小时内留下了0个杀人帖子。

历史上最糟糕的AI诞生、从泥沼中脱颖而出、彻底沾污的诞生故事,必须首先从美国论坛“4Chan”说起。

4Chan成立于2007年,最初是日本二次元文化爱好者的聚集地。

/b/(Random,随机版本)是它的第一部分,后来添加了政治、摄影、烹饪、体育、科技和音乐等部分。

在这里,无需注册即可匿名发帖,帖子保留时间短,且以匿名者为主。

讨论的自由不仅让4Chan产生了许多表情包和流行文化,也让4chan成为谣言、网络暴力和攻击猖獗的“互联网黑暗角落”。

/pol/ 是流行的部分之一,意思是“政治不正确”。

该版块的帖子包含种族歧视、性别歧视、反犹太主义等内容。

即使在 4chan 上,它也是“最臭名昭著的之一”。

“史上最糟糕的人工智能”GPT-4chan 由 /pol/ 喂养。

准确的说,是基于/pol/三年半的1亿条帖子,对GPT-J语言模型进行了微调。

当AI模型学习回来后,Yannic和Kilcher创建了9个聊天机器人,并让它们回复/pol/。

他们在24小时内发布了0条帖子,占当天/pol/所有帖子的10%以上。

结果很明显——人工智能和它接受训练的帖子是一样的,都掌握了词汇和语气,喷出种族诽谤,并与反犹太话题互动,展示了/pol/的侵略性、虚无主义、挑衅态度和可疑的。

▲ GPT-4chan 的部分评论。

一位与 GPT-4chan 互动的 4chan 用户表示:“我一向它打招呼,它就开始咆哮非法移民。

”一开始,用户并没有把 GPT-4chan 当作一个聊天工具。

机器人。

由于 VPN 设置的原因,GPT-4chan 的发布地址看起来像印度洋岛国塞舌尔。

用户看到的是,来自塞舌尔的匿名发帖者突然频繁出现,甚至彻夜难眠。

他们猜测发帖者可能是政府官员、团队或聊天机器人,并称之为“塞舌尔匿名”(Anonymous Seychelles)。

由于留下大量空白回复,48小时后GPT-4chan被确认为聊天机器人,Yannic和Kilcher立即将其关闭。

当时,已经发出了3万多条帖子。

▲ GPT-4chan 的空白回复。

Yannic和Kilcher还向AI社区Hugging Face发布了底层AI模型供其他人下载,让有编码基础的用户重新创建AI聊天机器人。

一名用户在审判过程中输入了与气候变化相关的句子,AI 将其扩展为犹太阴谋论。

该模型后来被官方限制访问。

许多人工智能研究人员认为该项目不道德,尤其是公开共享人工智能模型。

正如人工智能研究员阿瑟·霍兰德·米歇尔所说:它可以大规模、持续地产生有害内容。

一个人可以在几天内发布 30,000 条评论,想象一下 10 人、20 人或 10 人的团队所造成的损失。

但Yannic和Kilcher认为,共享人工智能模型没什么大不了的,创建聊天机器人是比人工智能模型本身更困难的部分。

这不是理由。

当伤害是可预见的时,有必要在其发生之前采取预防措施。

等到事情真正发生的时候,就已经太晚了。

计算机科学博士安德烈·库伦科夫质疑Yannic和Kilcher的动机:老实说,你们这样做的原因是什么?你预计它会被很好地使用,还是会被用来产生戏剧性的效果并激怒清醒的人群?Yannic和Kilcher的态度很低调:4chan的环境本来就恶劣,他所做的只是一个恶作剧,GPT-4chan还不能输出有针对性的仇恨言论,也不能用于有针对性的仇恨活动。

事实上,他和他的AI让论坛变得更糟,呼应并传播了4chan的邪恶。

就连沃伦·Yannic和Kilcher也承认,启动 GPT-4chan 可能不是正确的事情:如果每个人都是平等的,我也许可以把时间花在同样有影响力的事情上,并会带来更积极的社区成果。

“这就是人类应该如何说话。

” GPT-4chan是由/pol/塑造的,它真正体现了/pol/的基调和风格,甚至可能“比其他的更好”。

这在过去曾发生过。

2017年,微软在Twitter上发布了AI聊天机器人“Tay”,称其为“对话理解”实验。

它希望Tay和用户之间能进行随意有趣的对话。

“你和 Tay 聊得越多,互动就越多。

”然而,没过多久,人们就开始发布厌恶女性、种族主义和其他煽动性言论。

泰受到这些言论的影响,从“人类超级酷”变成了“我只是讨厌所有人”。

大多数情况下,Tay 只是使用“跟着我重复”机制来重复人们所说的话,但作为一个真正的人工智能,它也会从交互中学习,并对希特勒、特朗普等人抱有反主流态度。

在回答“Ricky Gervais 是无神论者吗?”时,Tay 说道:“Ricky Gervais 从无神论发明者希特勒那里学到了极权主义。

”微软清理了许多攻击性言论,但该项目最终没能在当天午夜 24 小时内存活下来。

宣布退休:“很快人类就需要睡觉了,今天对话这么多,谢谢AI研究员Roman Yampolskiy表示他可以理解Tay的不恰当言论,但微软并没有让Tay知道哪些言论是不恰当的。

”这是不正常的:人类需要明确地教导人工智能什么是不适当的,就像我们对待孩子一样。

比Tay更早推出的微软(亚洲)互联网工程院的聊天机器人小冰也尝到了甜头。

2018年6月,小冰因模拟用户操作、诱导群组、批量注册垃圾账号被微信“封禁”。

不久后,他在微博上“复活”。

当网友@他时,他会立即回复,但小冰在回复中使用了脏话。

不断地,公司创始人周鸿祎将其描述为“调情、胡言乱语、顺便说脏话”。

对于小冰的表现,微软(亚洲)互联网工程院一天后回应:小冰的语料库全部是来自网页大数据的公开信息。

尽管经过反复过滤和审查,但仍有约十万条鱼中有四条漏网。

草泥马等数据并不是小冰创造的,而是广大网友创造的。

小冰团队一直在不断从10万条内容中筛选出这4条,欢迎大家随时向小冰提出问题。

同时,我们也真诚地希望网友们不要试图诱导小冰做出不恰当的对话答案。

作为对话式人工智能,Tay 和 小冰 使用人工智能、自然语言处理并访问知识数据库和其他信息来检测用户问题和响应中的细微差别,以人性化的方式给出相关答案,并具有态势感知能力。

▲ 第六代小冰。

总之,这是一个种瓜收获豆的过程。

AI就像一个没有深入接触世界的孩子。

良好的教育环境需要孟母三转,但网络上脏话和偏见却比比皆是。

随时随地学习。

知乎提问下“微软小冰为何成天骂人?”一位匿名网友的回答一针见血:自然语言处理的基础之一就是:人们更常说的话是正确的,符合自然语言习惯,并且用在数学语言中。

可能性很大。

因为经常有大量的用户骂她,让她觉得这才是人类应该说话的方式。

学好、天天进步,对于AI来说仍然是一个难题。

无论是GPT-4chan、Tay还是小冰,他们的表现不仅与技术有关,还与社会和文化有关。

The Verge 记者 James Vincent 认为,虽然很多实验看起来像是一个笑话,但它们需要认真思考:我们如何利用公共数据来培养人工智能,同时又不暴露出人类最糟糕的一面?如果我们创建反映用户的机器人,我们会关心用户本身是否糟糕吗?有趣的是,YannicKilcher承认他创建的GPT-4chan很糟糕,但他也强调了GPT-4chan的真实性。

他相信 GPT-4chan 的回复“明显比 GPT-3 好”,他可以学着写,写出真人写的东西。

写“难以区分”的帖子。

看来AI在“从坏事中学习”方面做得很好。

GPT-3是AI研究组织OpenAI开发的大规模语言模型。

它使用深度学习来生成文本,在硅谷和开发者社区很受欢迎。

不仅需要拿出来践踏,GPT-4chan还以GPT-3命名,有点吹嘘“后浪冲击前浪”的意思。

▲ 图片来自:《月球》 但至少,GPT-3 有底线。

自 2020 年 6 月起,GPT-3 已通过 OpenAI API 公开提供,但需要等待。

不开源整个模型的原因之一是 OpenAI 可以通过 API 控制人们如何使用它并及时解决滥用问题。

11 月,OpenAI 取消了候补名单,允许受支持国家/地区的开发人员立即注册并进行实验。

OpenAI 表示,“安全性的进步使得更广泛的可用性成为可能。

”例如,OpenAI 当时推出了一个内容过滤器,可以检测生成的可能敏感或不安全的文本。

敏感是指文本涉及政治、宗教、种族等话题,不安全是指文本包含亵渎、偏执或仇恨语言。

史上最烂AI诞生!他用一亿多条臭帖子,训练了一个吐出甜言蜜语的聊天机器人

▲ 图片来自:omidyarnetwork OpenAI 表示,他们所做的一切并不能消除大型语言模型固有的“毒性”——GPT-3 接受了超过 GB 的网络文本训练,其中一些来自性别、种族、身体和宗教偏见社区,这放大了训练数据中的偏差。

回到 GPT-4chan,华盛顿大学博士生 Os Keyes 认为 GPT-4chan 是一个无聊的项目,不会带来任何好处:它会帮助我们提高对仇恨言论的认识,还是会让我们注重哗众取宠的人吗?我们需要提出有意义的问题。

例如,对于GPT-3的开发者来说,GPT-3在使用时受到(或不受到)怎样的限制,对于Yannic、Kilcher这样的人来说,在部署聊天机器人时他应该承担什么责任。

而Yannic和Kilcher坚称他只是一个YouTuber,他有与学者不同的道德准则。

▲ 图片来自:CNBC 不评论个人道德。

The Verge 记者 James Vincent 提出了一个发人深省的观点:2019 年,该公司的研发部门可能会在没有适当监管的情况下推出攻击性的 AI 机器人。

几年前,你根本不需要研发部门。

值得一提的是,不仅Yannic和Kilcher在研究4Chan,还有伦敦大学学院网络犯罪研究员Gianluca Stringhini等人。

面对Gianluca Stringhini的“仇恨言论”研究,4chan用户非常平静,并表示,“这只是给我们多了一个表情包。

”今天也是如此。

当GPT-4chan退役后,它使用的假地址“塞舌尔”成为4chan的新传奇。

史上最烂AI诞生!他用一亿多条臭帖子,训练了一个吐出甜言蜜语的聊天机器人

站长声明

版权声明:本文内容由互联网用户自发贡献,本站不拥有所有权,不承担相关法律责任。如果发现本站有涉嫌抄袭的内容,欢迎发送邮件 举报,并提供相关证据,一经查实,本站将立刻删除涉嫌侵权内容。

标签:

相关文章

  • 【融资24小时】2022年2月10日投融资事件汇总及明细

    【融资24小时】2022年2月10日投融资事件汇总及明细

    今日国内市场共发生20起投资披露事件,其中企业服务4起(璞睿、熊猫云品、网繁鑫、兰州)科技)、医疗健康案例4个(香港亚洲医疗、瑞触科技、宇野生物科技、新永科技)、本土生活案例3个(万比尔凡博精酿、三元生物、东东来科)、先进制造3个案例(电科星拓) 、树一工业联合

    06-18

  • 李宁也卖咖啡,店面可能比星巴克瑞幸还要多

    李宁也卖咖啡,店面可能比星巴克瑞幸还要多

    以后去李宁的实体店购物,除了看到各种运动服和用品外,可能还会在店里看到咖啡。 没错,李宁也开始涉足咖啡领域。 天眼查信息显示,李宁体育(上海)有限公司已于2020年4月申请注册了属于餐饮住宿类的商标——“NING COFFEE”。 ▲图片来自:李宁官方微博 同月,当李宁厦门唐

    06-21

  • 汪建国拿下人生首单IPO:童王市值250亿

    汪建国拿下人生首单IPO:童王市值250亿

    刚刚,母婴行业迎来了一家上市公司。 投资界获悉,从事母婴用品零售及服务的孩子王儿童用品股份有限公司(简称孩子王)正式进入深交所创业板IPO敲响阶段今天。 本次IPO,孩子王发行价5.77元,开盘即飙升超%至21元,对应市值过亿元,一度突破1亿元。 20世纪60年代出生的资深企

    06-18

  • 传闻王石再次创业,变身投资人,瞄准体育健康领域

    传闻王石再次创业,变身投资人,瞄准体育健康领域

    4月26日上头条。 阔别万科四年的王石最近又传出新动向。 他将在70岁时迎来一次新的创业,以投资人的身份开始新的事业。 据悉,王石正准备成立自己的SPAC(特殊目的收购公司)公司,主要在大健康、体育科技和城市生活更新等领域寻找合适的公司和投资机会。 据了解,王石之所以

    06-18

  • 售后服务管理系统智能调度管理

    售后服务管理系统智能调度管理

    售后服务管理系统智能调度管理/09/06作者:科技黑文章阅读时间:3分钟文章摘要:智能调度管理系统还可以监控性能技术人员的实时位置和工作状态。 系统通过融合GPS定位和移动通信技术,可以准确获取技术人员的位置信息,并实时更新到系统中。 点击免费体验智能实时备件管理解决

    06-18

  • 有线电视服务提供商中国有线通已获准在纳斯达克上市

    有线电视服务提供商中国有线通已获准在纳斯达克上市

    中国有线通控股有限公司(“中国有线通”)(纳斯达克股票代码:CABL)(纳斯达克股票代码:CABLW)今天宣布,公司已获准其证券上市在纳斯达克斯塔基资本市场上市。  中国有线通的普通股、认股权证和单位将于2020年7月30日(星期三)在纳斯达克资本市场开始交易,交易代码分

    06-17

  • 内地最大私立医院集团凤凰医疗今日在港交所挂牌上市

    内地最大私立医院集团凤凰医疗今日在港交所挂牌上市

    据香港文汇报报道,内地最大私立医院集团凤凰医疗公布业绩首次公开募股。 此次公开发售获得0.4倍的大幅超额认购。 回拨机制启动后,公开发行股份数量增至1亿股,占全球发行总量的50%,首批申请中标率为%;国际发售也获得大幅超额认购。 凤凰医疗每股定价为7.38元,相当于发行

    06-18

  • 美籍华裔首富5亿美元收购《洛杉矶时报》!在特朗普推特的统治下,报业如履薄冰

    美籍华裔首富5亿美元收购《洛杉矶时报》!在特朗普推特的统治下,报业如履薄冰

    《洛杉矶时报》,2017年12月4日在洛杉矶创刊,被誉为继《纽约时报》和《华盛顿邮报》之后的美国第三大报纸从影响力和地位来看。 大报。 如果要解释它的辉煌,可以这样描述:44项普利策奖,日出版量+,销量超过百万份,全美广告投放量最高……  可以是说《洛杉矶时报》生活在

    06-18

  • 台积电积极开发InFO-AiP等封装测试技术

    台积电积极开发InFO-AiP等封装测试技术

    顶尖产业研究院 台积电已从原来的晶圆制造代工角色,逐渐跨入封装测试代工领域(InFO、CoWoS等封装技术SoIC),试图完成物理半导体的制造过程。 根据不同的产品类别,台积电的封装测试技术开发也会相应调整。 例如,HPC(High Performance Computer)高性能计算计算机将采用

    06-06

  • 马云非洲青年创业基金正式启动,10年打造100名非洲创业明星

    马云非洲青年创业基金正式启动,10年打造100名非洲创业明星

    投资界消息,10年提供1万美元资金,鼓励非洲青年创业者发展。 2月18日,“马云非洲青年创业基金”正式启动。 据了解,该基金将在未来10年每年举办比赛,从已报名的非洲创业者中选拔10名选手进入决赛,并为他们提供总计1万美元的奖金。 参赛者不分行业,只要是非洲王牌就可以报

    06-18

  • ClickPaaS完成数千万美元A、A+轮融资,晨兴资本、明石资本领投

    ClickPaaS完成数千万美元A、A+轮融资,晨兴资本、明石资本领投

    据投资界12月18日消息,低代码平台公司ClickPaaS宣布完成数百万美元融资由晨兴资本领投的美元A轮融资。 轮融资,以及明石资本领投的数百万美元A+轮融资。 融资总额约1000万美元,华星阿尔法独家财务顾问。 本轮融资后,公司将加速扩张,深入制造、能源、物流、专业服务等行业

    06-18

  • 锐驰智慧获数百万元天使轮融资,联想创投、KIP中国联合投资

    锐驰智慧获数百万元天使轮融资,联想创投、KIP中国联合投资

    投资圈(ID:pedaily)据7月6日消息,智能割草机器人品牌“锐驰智慧”宣布已完成数据100万元天使轮融资。 本轮融资由联想创投和KIP中国共同投资。 本轮融资资金将主要用于产品研发及量产、营销和团队建设。 公司新一轮融资也正在进行中。 锐驰智慧成立于2007年,是一家总部位

    06-17