首页 > 科技未来 > 内容

史上最烂AI诞生!他用一亿多条臭帖子,训练了一个吐出甜言蜜语的聊天机器人

发布于:2024-06-21 编辑:匿名 来源:网络

“来聊一会儿吧。

” “你这个大萨比~”调皮的语气掩盖不了诅咒的本质。

这只是微软小冰微博“大萨比~”“杀光所有人”的一幕。

近日,又一位自称“史上最糟糕的AI”的“小冰”出现了。

它的名字叫GPT-4chan,由YouTubers、AI研究员、Yannic和Kilcher创建,24小时内留下了0个杀人帖子。

历史上最糟糕的AI诞生、从泥沼中脱颖而出、彻底沾污的诞生故事,必须首先从美国论坛“4Chan”说起。

4Chan成立于2007年,最初是日本二次元文化爱好者的聚集地。

/b/(Random,随机版本)是它的第一部分,后来添加了政治、摄影、烹饪、体育、科技和音乐等部分。

在这里,无需注册即可匿名发帖,帖子保留时间短,且以匿名者为主。

讨论的自由不仅让4Chan产生了许多表情包和流行文化,也让4chan成为谣言、网络暴力和攻击猖獗的“互联网黑暗角落”。

/pol/ 是流行的部分之一,意思是“政治不正确”。

该版块的帖子包含种族歧视、性别歧视、反犹太主义等内容。

即使在 4chan 上,它也是“最臭名昭著的之一”。

“史上最糟糕的人工智能”GPT-4chan 由 /pol/ 喂养。

准确的说,是基于/pol/三年半的1亿条帖子,对GPT-J语言模型进行了微调。

当AI模型学习回来后,Yannic和Kilcher创建了9个聊天机器人,并让它们回复/pol/。

他们在24小时内发布了0条帖子,占当天/pol/所有帖子的10%以上。

结果很明显——人工智能和它接受训练的帖子是一样的,都掌握了词汇和语气,喷出种族诽谤,并与反犹太话题互动,展示了/pol/的侵略性、虚无主义、挑衅态度和可疑的。

▲ GPT-4chan 的部分评论。

一位与 GPT-4chan 互动的 4chan 用户表示:“我一向它打招呼,它就开始咆哮非法移民。

”一开始,用户并没有把 GPT-4chan 当作一个聊天工具。

机器人。

由于 VPN 设置的原因,GPT-4chan 的发布地址看起来像印度洋岛国塞舌尔。

用户看到的是,来自塞舌尔的匿名发帖者突然频繁出现,甚至彻夜难眠。

他们猜测发帖者可能是政府官员、团队或聊天机器人,并称之为“塞舌尔匿名”(Anonymous Seychelles)。

由于留下大量空白回复,48小时后GPT-4chan被确认为聊天机器人,Yannic和Kilcher立即将其关闭。

当时,已经发出了3万多条帖子。

▲ GPT-4chan 的空白回复。

Yannic和Kilcher还向AI社区Hugging Face发布了底层AI模型供其他人下载,让有编码基础的用户重新创建AI聊天机器人。

一名用户在审判过程中输入了与气候变化相关的句子,AI 将其扩展为犹太阴谋论。

该模型后来被官方限制访问。

许多人工智能研究人员认为该项目不道德,尤其是公开共享人工智能模型。

正如人工智能研究员阿瑟·霍兰德·米歇尔所说:它可以大规模、持续地产生有害内容。

一个人可以在几天内发布 30,000 条评论,想象一下 10 人、20 人或 10 人的团队所造成的损失。

但Yannic和Kilcher认为,共享人工智能模型没什么大不了的,创建聊天机器人是比人工智能模型本身更困难的部分。

这不是理由。

当伤害是可预见的时,有必要在其发生之前采取预防措施。

等到事情真正发生的时候,就已经太晚了。

计算机科学博士安德烈·库伦科夫质疑Yannic和Kilcher的动机:老实说,你们这样做的原因是什么?你预计它会被很好地使用,还是会被用来产生戏剧性的效果并激怒清醒的人群?Yannic和Kilcher的态度很低调:4chan的环境本来就恶劣,他所做的只是一个恶作剧,GPT-4chan还不能输出有针对性的仇恨言论,也不能用于有针对性的仇恨活动。

事实上,他和他的AI让论坛变得更糟,呼应并传播了4chan的邪恶。

就连沃伦·Yannic和Kilcher也承认,启动 GPT-4chan 可能不是正确的事情:如果每个人都是平等的,我也许可以把时间花在同样有影响力的事情上,并会带来更积极的社区成果。

“这就是人类应该如何说话。

” GPT-4chan是由/pol/塑造的,它真正体现了/pol/的基调和风格,甚至可能“比其他的更好”。

这在过去曾发生过。

2017年,微软在Twitter上发布了AI聊天机器人“Tay”,称其为“对话理解”实验。

它希望Tay和用户之间能进行随意有趣的对话。

“你和 Tay 聊得越多,互动就越多。

”然而,没过多久,人们就开始发布厌恶女性、种族主义和其他煽动性言论。

泰受到这些言论的影响,从“人类超级酷”变成了“我只是讨厌所有人”。

大多数情况下,Tay 只是使用“跟着我重复”机制来重复人们所说的话,但作为一个真正的人工智能,它也会从交互中学习,并对希特勒、特朗普等人抱有反主流态度。

在回答“Ricky Gervais 是无神论者吗?”时,Tay 说道:“Ricky Gervais 从无神论发明者希特勒那里学到了极权主义。

”微软清理了许多攻击性言论,但该项目最终没能在当天午夜 24 小时内存活下来。

宣布退休:“很快人类就需要睡觉了,今天对话这么多,谢谢AI研究员Roman Yampolskiy表示他可以理解Tay的不恰当言论,但微软并没有让Tay知道哪些言论是不恰当的。

”这是不正常的:人类需要明确地教导人工智能什么是不适当的,就像我们对待孩子一样。

比Tay更早推出的微软(亚洲)互联网工程院的聊天机器人小冰也尝到了甜头。

2018年6月,小冰因模拟用户操作、诱导群组、批量注册垃圾账号被微信“封禁”。

不久后,他在微博上“复活”。

当网友@他时,他会立即回复,但小冰在回复中使用了脏话。

不断地,公司创始人周鸿祎将其描述为“调情、胡言乱语、顺便说脏话”。

对于小冰的表现,微软(亚洲)互联网工程院一天后回应:小冰的语料库全部是来自网页大数据的公开信息。

尽管经过反复过滤和审查,但仍有约十万条鱼中有四条漏网。

草泥马等数据并不是小冰创造的,而是广大网友创造的。

小冰团队一直在不断从10万条内容中筛选出这4条,欢迎大家随时向小冰提出问题。

同时,我们也真诚地希望网友们不要试图诱导小冰做出不恰当的对话答案。

作为对话式人工智能,Tay 和 小冰 使用人工智能、自然语言处理并访问知识数据库和其他信息来检测用户问题和响应中的细微差别,以人性化的方式给出相关答案,并具有态势感知能力。

▲ 第六代小冰。

总之,这是一个种瓜收获豆的过程。

AI就像一个没有深入接触世界的孩子。

良好的教育环境需要孟母三转,但网络上脏话和偏见却比比皆是。

随时随地学习。

知乎提问下“微软小冰为何成天骂人?”一位匿名网友的回答一针见血:自然语言处理的基础之一就是:人们更常说的话是正确的,符合自然语言习惯,并且用在数学语言中。

可能性很大。

因为经常有大量的用户骂她,让她觉得这才是人类应该说话的方式。

学好、天天进步,对于AI来说仍然是一个难题。

无论是GPT-4chan、Tay还是小冰,他们的表现不仅与技术有关,还与社会和文化有关。

The Verge 记者 James Vincent 认为,虽然很多实验看起来像是一个笑话,但它们需要认真思考:我们如何利用公共数据来培养人工智能,同时又不暴露出人类最糟糕的一面?如果我们创建反映用户的机器人,我们会关心用户本身是否糟糕吗?有趣的是,YannicKilcher承认他创建的GPT-4chan很糟糕,但他也强调了GPT-4chan的真实性。

他相信 GPT-4chan 的回复“明显比 GPT-3 好”,他可以学着写,写出真人写的东西。

写“难以区分”的帖子。

看来AI在“从坏事中学习”方面做得很好。

GPT-3是AI研究组织OpenAI开发的大规模语言模型。

它使用深度学习来生成文本,在硅谷和开发者社区很受欢迎。

不仅需要拿出来践踏,GPT-4chan还以GPT-3命名,有点吹嘘“后浪冲击前浪”的意思。

▲ 图片来自:《月球》 但至少,GPT-3 有底线。

自 2020 年 6 月起,GPT-3 已通过 OpenAI API 公开提供,但需要等待。

不开源整个模型的原因之一是 OpenAI 可以通过 API 控制人们如何使用它并及时解决滥用问题。

11 月,OpenAI 取消了候补名单,允许受支持国家/地区的开发人员立即注册并进行实验。

OpenAI 表示,“安全性的进步使得更广泛的可用性成为可能。

”例如,OpenAI 当时推出了一个内容过滤器,可以检测生成的可能敏感或不安全的文本。

敏感是指文本涉及政治、宗教、种族等话题,不安全是指文本包含亵渎、偏执或仇恨语言。

史上最烂AI诞生!他用一亿多条臭帖子,训练了一个吐出甜言蜜语的聊天机器人

▲ 图片来自:omidyarnetwork OpenAI 表示,他们所做的一切并不能消除大型语言模型固有的“毒性”——GPT-3 接受了超过 GB 的网络文本训练,其中一些来自性别、种族、身体和宗教偏见社区,这放大了训练数据中的偏差。

回到 GPT-4chan,华盛顿大学博士生 Os Keyes 认为 GPT-4chan 是一个无聊的项目,不会带来任何好处:它会帮助我们提高对仇恨言论的认识,还是会让我们注重哗众取宠的人吗?我们需要提出有意义的问题。

例如,对于GPT-3的开发者来说,GPT-3在使用时受到(或不受到)怎样的限制,对于Yannic、Kilcher这样的人来说,在部署聊天机器人时他应该承担什么责任。

而Yannic和Kilcher坚称他只是一个YouTuber,他有与学者不同的道德准则。

▲ 图片来自:CNBC 不评论个人道德。

The Verge 记者 James Vincent 提出了一个发人深省的观点:2019 年,该公司的研发部门可能会在没有适当监管的情况下推出攻击性的 AI 机器人。

几年前,你根本不需要研发部门。

值得一提的是,不仅Yannic和Kilcher在研究4Chan,还有伦敦大学学院网络犯罪研究员Gianluca Stringhini等人。

面对Gianluca Stringhini的“仇恨言论”研究,4chan用户非常平静,并表示,“这只是给我们多了一个表情包。

”今天也是如此。

当GPT-4chan退役后,它使用的假地址“塞舌尔”成为4chan的新传奇。

史上最烂AI诞生!他用一亿多条臭帖子,训练了一个吐出甜言蜜语的聊天机器人

站长声明

版权声明:本文内容由互联网用户自发贡献,本站不拥有所有权,不承担相关法律责任。如果发现本站有涉嫌抄袭的内容,欢迎发送邮件 举报,并提供相关证据,一经查实,本站将立刻删除涉嫌侵权内容。

标签:

相关文章

  • 蜂巢资本首期投资20亿,致力于打造电池行业生态圈

    蜂巢资本首期投资20亿,致力于打造电池行业生态圈

    4月21日上头条昨天,蜂巢能源在上海车展期间开启了首个创新日。 与此同时,蜂巢能源宣布成立蜂巢资本,投资20亿元资金支持产业创新。 计划招募20家跨境产业合作伙伴,面向全球招募创新人才,致力于打造动力电池产业产学研用。 联合跨境融合创新生态系统。 据悉,蜂巢能源科技

    06-18

  • 知识产权大数据公司智呱呱完成数亿元B轮融资

    知识产权大数据公司智呱呱完成数亿元B轮融资

    投资圈(微信ID:pedaily)据11月24日消息,知识产权大数据及整体解决方案提供商智呱呱宣布完成数亿元融资人民币B轮融资。 融资。 本轮融资由中关村龙门基金领投,青控银杏管理的国家中小企业发展基金跟投。 此前,智瓜瓜曾于2016年获得1万元A轮融资,华英资本是其A轮投资方之

    06-18

  • 新华章完成4亿余元Pre-B轮融资,由云锋基金领投

    新华章完成4亿余元Pre-B轮融资,由云锋基金领投

    新华章近日宣布完成4亿余元Pre-B轮融资,由云锋基金领投,经纬中国、Pro Capital(旗下国开装备基金)参与投资。

    06-18

  • 上海电气拟参与“临港科技前沿基金”

    上海电气拟参与“临港科技前沿基金”

    上海电气集团有限公司(以下简称“公司”或“上海电气”)拟通过其全资子公司上海电气进行投资电气投资有限公司(以下简称“电气投资”)借助专业管理机构寻找、储备和培育优质项目资源,以自有资金4.9亿元入股上海临港国泰君安科技前沿产业私募股权基金合伙企业(有限合伙)

    06-18

  • AIB资本胡艳:探索创投机构的长青之路

    AIB资本胡艳:探索创投机构的长青之路

    2020年12月13日至15日,中国创投年度盛会——第二十三届中国股权投资年度论坛在上海举行。 本次峰会由上海市地方金融监督管理局指导,清科创业投资社区主办。 汇聚国内活跃的创投力量,共同探讨行业“持续性与适应性”的主题,探讨中国股权投资行业的现状。 和未来。 会上,

    06-17

  • 中国联通将率先推出iPhone 4S,中国电信10月开售传闻已破灭

    中国联通将率先推出iPhone 4S,中国电信10月开售传闻已破灭

    10月8日消息,根据业内人士的爆料以及多家投行的预测,苹果刚刚发布的iPhone 4S在中国大陆仍然有其第一家合作伙伴。 首先是中国联通,其次是中国电信。 预计中国电信将晚于中国联通推出CDMA版iPhone 4S。 此前有关中国电信将在10月份销售iPhone 5的传言自然已经破灭。    此

    06-18

  • 力同拟现金收购纳斯达克上市公司太平洋互联

    力同拟现金收购纳斯达克上市公司太平洋互联

    5月12日,IP语音(VoIP)电话服务提供商力同网络软件股份有限公司(MediaRing Ltd.)宣布在纳斯达克A股上市以现金要约收购 Pacific Internet Limited 发行的所有股份。 该要约的投标有效期截止于2020年6月12日纽约时间午夜12:00。 截止日期可能会因力通网络或其代表随时宣布的

    06-18

  • 泛生子基因科技获超4亿元C轮融资,专注精准肿瘤医疗

    泛生子基因科技获超4亿元C轮融资,专注精准肿瘤医疗

    据投资界1月4日消息,北京泛生子基因科技有限公司已完成超4亿元融资在C轮融资中。 本轮融资由中国金康瑞领投,元兴资本、深商产业基金等机构跟投。   据了解,本轮募集资金将用于技术研发、产品线拓展、市场教育、大数据积累等,重点推动液体活检技术在肿瘤诊断和治疗领域

    06-18

  • 手游直播平台“触手TV”获新一轮5亿元融资,谷歌领投

    手游直播平台“触手TV”获新一轮5亿元融资,谷歌领投

    据投资界12月27日消息,近日有消息称手游直播播出平台“触手TV”获新一轮5亿元融资。 在谷歌领投的一轮融资中,DoNews询问了接近触手卫视的内部人士人士,人士表示该消息属实。   触手TV是一家专注于手游的弹幕式直播平台。 今年7月正式上线。 目前拥有超过10万名玩家、主播

    06-18

  • 腾讯投资网络游戏公司五都科技

    腾讯投资网络游戏公司五都科技

    据11月23日消息,天眼查App显示,11月20日,浙江五都科技有限公司进行工商变更,注册方式新增投资方式广西腾讯创业投资有限公司,后者由深圳市腾讯产业投资基金有限公司全资拥有。 天眼查App显示,浙江五都科技有限公司于1月成立,注册资本1万元。 法定代表人是郑明。 经营范

    06-18

  • 腾讯投资阿里巴巴创业电商项目,好衣库完成数亿元B轮融资

    腾讯投资阿里巴巴创业电商项目,好衣库完成数亿元B轮融资

    据投资界7月17日消息,社交电商平台好衣库完成数亿元B轮融资在B轮融资中。 腾讯领投,IDG、先锋付登、袁晶等机构跟投。   就在上个月,好衣库刚刚获得亿元A轮融资。 目前,好衣库已完成3轮融资。 详情如下表所示:   耀明成立于2018年8月,定位为S2b2C社区商城——建立平

    06-18

  • 宜家最酷的未来产品都来自这个神秘的实验室

    宜家最酷的未来产品都来自这个神秘的实验室

    在哥本哈根肉类加工区的中心地带,有无数的画廊、艺术咖啡馆和创意工作室。 其中有一栋由鱼市场改建而成的平米建筑。 利用技术和好奇心来绘制宜家的未来蓝图。 这就是宜家资助的 SPACE10 冒险之旅的起点。 作为宜家的未来生活实验室和产品创意孵化器,SPACE10总是开发一些超级

    06-21