蜂巢资本首期投资20亿,致力于打造电池行业生态圈
06-18
“来聊一会儿吧。
” “你这个大萨比~”调皮的语气掩盖不了诅咒的本质。
这只是微软小冰微博“大萨比~”“杀光所有人”的一幕。
近日,又一位自称“史上最糟糕的AI”的“小冰”出现了。
它的名字叫GPT-4chan,由YouTubers、AI研究员、Yannic和Kilcher创建,24小时内留下了0个杀人帖子。
历史上最糟糕的AI诞生、从泥沼中脱颖而出、彻底沾污的诞生故事,必须首先从美国论坛“4Chan”说起。
4Chan成立于2007年,最初是日本二次元文化爱好者的聚集地。
/b/(Random,随机版本)是它的第一部分,后来添加了政治、摄影、烹饪、体育、科技和音乐等部分。
在这里,无需注册即可匿名发帖,帖子保留时间短,且以匿名者为主。
讨论的自由不仅让4Chan产生了许多表情包和流行文化,也让4chan成为谣言、网络暴力和攻击猖獗的“互联网黑暗角落”。
/pol/ 是流行的部分之一,意思是“政治不正确”。
该版块的帖子包含种族歧视、性别歧视、反犹太主义等内容。
即使在 4chan 上,它也是“最臭名昭著的之一”。
“史上最糟糕的人工智能”GPT-4chan 由 /pol/ 喂养。
准确的说,是基于/pol/三年半的1亿条帖子,对GPT-J语言模型进行了微调。
当AI模型学习回来后,Yannic和Kilcher创建了9个聊天机器人,并让它们回复/pol/。
他们在24小时内发布了0条帖子,占当天/pol/所有帖子的10%以上。
结果很明显——人工智能和它接受训练的帖子是一样的,都掌握了词汇和语气,喷出种族诽谤,并与反犹太话题互动,展示了/pol/的侵略性、虚无主义、挑衅态度和可疑的。
▲ GPT-4chan 的部分评论。
一位与 GPT-4chan 互动的 4chan 用户表示:“我一向它打招呼,它就开始咆哮非法移民。
”一开始,用户并没有把 GPT-4chan 当作一个聊天工具。
机器人。
由于 VPN 设置的原因,GPT-4chan 的发布地址看起来像印度洋岛国塞舌尔。
用户看到的是,来自塞舌尔的匿名发帖者突然频繁出现,甚至彻夜难眠。
他们猜测发帖者可能是政府官员、团队或聊天机器人,并称之为“塞舌尔匿名”(Anonymous Seychelles)。
由于留下大量空白回复,48小时后GPT-4chan被确认为聊天机器人,Yannic和Kilcher立即将其关闭。
当时,已经发出了3万多条帖子。
▲ GPT-4chan 的空白回复。
Yannic和Kilcher还向AI社区Hugging Face发布了底层AI模型供其他人下载,让有编码基础的用户重新创建AI聊天机器人。
一名用户在审判过程中输入了与气候变化相关的句子,AI 将其扩展为犹太阴谋论。
该模型后来被官方限制访问。
许多人工智能研究人员认为该项目不道德,尤其是公开共享人工智能模型。
正如人工智能研究员阿瑟·霍兰德·米歇尔所说:它可以大规模、持续地产生有害内容。
一个人可以在几天内发布 30,000 条评论,想象一下 10 人、20 人或 10 人的团队所造成的损失。
但Yannic和Kilcher认为,共享人工智能模型没什么大不了的,创建聊天机器人是比人工智能模型本身更困难的部分。
这不是理由。
当伤害是可预见的时,有必要在其发生之前采取预防措施。
等到事情真正发生的时候,就已经太晚了。
计算机科学博士安德烈·库伦科夫质疑Yannic和Kilcher的动机:老实说,你们这样做的原因是什么?你预计它会被很好地使用,还是会被用来产生戏剧性的效果并激怒清醒的人群?Yannic和Kilcher的态度很低调:4chan的环境本来就恶劣,他所做的只是一个恶作剧,GPT-4chan还不能输出有针对性的仇恨言论,也不能用于有针对性的仇恨活动。
事实上,他和他的AI让论坛变得更糟,呼应并传播了4chan的邪恶。
就连沃伦·Yannic和Kilcher也承认,启动 GPT-4chan 可能不是正确的事情:如果每个人都是平等的,我也许可以把时间花在同样有影响力的事情上,并会带来更积极的社区成果。
“这就是人类应该如何说话。
” GPT-4chan是由/pol/塑造的,它真正体现了/pol/的基调和风格,甚至可能“比其他的更好”。
这在过去曾发生过。
2017年,微软在Twitter上发布了AI聊天机器人“Tay”,称其为“对话理解”实验。
它希望Tay和用户之间能进行随意有趣的对话。
“你和 Tay 聊得越多,互动就越多。
”然而,没过多久,人们就开始发布厌恶女性、种族主义和其他煽动性言论。
泰受到这些言论的影响,从“人类超级酷”变成了“我只是讨厌所有人”。
大多数情况下,Tay 只是使用“跟着我重复”机制来重复人们所说的话,但作为一个真正的人工智能,它也会从交互中学习,并对希特勒、特朗普等人抱有反主流态度。
在回答“Ricky Gervais 是无神论者吗?”时,Tay 说道:“Ricky Gervais 从无神论发明者希特勒那里学到了极权主义。
”微软清理了许多攻击性言论,但该项目最终没能在当天午夜 24 小时内存活下来。
宣布退休:“很快人类就需要睡觉了,今天对话这么多,谢谢AI研究员Roman Yampolskiy表示他可以理解Tay的不恰当言论,但微软并没有让Tay知道哪些言论是不恰当的。
”这是不正常的:人类需要明确地教导人工智能什么是不适当的,就像我们对待孩子一样。
比Tay更早推出的微软(亚洲)互联网工程院的聊天机器人小冰也尝到了甜头。
2018年6月,小冰因模拟用户操作、诱导群组、批量注册垃圾账号被微信“封禁”。
不久后,他在微博上“复活”。
当网友@他时,他会立即回复,但小冰在回复中使用了脏话。
不断地,公司创始人周鸿祎将其描述为“调情、胡言乱语、顺便说脏话”。
对于小冰的表现,微软(亚洲)互联网工程院一天后回应:小冰的语料库全部是来自网页大数据的公开信息。
尽管经过反复过滤和审查,但仍有约十万条鱼中有四条漏网。
草泥马等数据并不是小冰创造的,而是广大网友创造的。
小冰团队一直在不断从10万条内容中筛选出这4条,欢迎大家随时向小冰提出问题。
同时,我们也真诚地希望网友们不要试图诱导小冰做出不恰当的对话答案。
作为对话式人工智能,Tay 和 小冰 使用人工智能、自然语言处理并访问知识数据库和其他信息来检测用户问题和响应中的细微差别,以人性化的方式给出相关答案,并具有态势感知能力。
。
▲ 第六代小冰。
总之,这是一个种瓜收获豆的过程。
AI就像一个没有深入接触世界的孩子。
良好的教育环境需要孟母三转,但网络上脏话和偏见却比比皆是。
随时随地学习。
知乎提问下“微软小冰为何成天骂人?”一位匿名网友的回答一针见血:自然语言处理的基础之一就是:人们更常说的话是正确的,符合自然语言习惯,并且用在数学语言中。
可能性很大。
因为经常有大量的用户骂她,让她觉得这才是人类应该说话的方式。
学好、天天进步,对于AI来说仍然是一个难题。
无论是GPT-4chan、Tay还是小冰,他们的表现不仅与技术有关,还与社会和文化有关。
The Verge 记者 James Vincent 认为,虽然很多实验看起来像是一个笑话,但它们需要认真思考:我们如何利用公共数据来培养人工智能,同时又不暴露出人类最糟糕的一面?如果我们创建反映用户的机器人,我们会关心用户本身是否糟糕吗?有趣的是,YannicKilcher承认他创建的GPT-4chan很糟糕,但他也强调了GPT-4chan的真实性。
他相信 GPT-4chan 的回复“明显比 GPT-3 好”,他可以学着写,写出真人写的东西。
写“难以区分”的帖子。
看来AI在“从坏事中学习”方面做得很好。
GPT-3是AI研究组织OpenAI开发的大规模语言模型。
它使用深度学习来生成文本,在硅谷和开发者社区很受欢迎。
不仅需要拿出来践踏,GPT-4chan还以GPT-3命名,有点吹嘘“后浪冲击前浪”的意思。
▲ 图片来自:《月球》 但至少,GPT-3 有底线。
自 2020 年 6 月起,GPT-3 已通过 OpenAI API 公开提供,但需要等待。
不开源整个模型的原因之一是 OpenAI 可以通过 API 控制人们如何使用它并及时解决滥用问题。
11 月,OpenAI 取消了候补名单,允许受支持国家/地区的开发人员立即注册并进行实验。
OpenAI 表示,“安全性的进步使得更广泛的可用性成为可能。
”例如,OpenAI 当时推出了一个内容过滤器,可以检测生成的可能敏感或不安全的文本。
敏感是指文本涉及政治、宗教、种族等话题,不安全是指文本包含亵渎、偏执或仇恨语言。

▲ 图片来自:omidyarnetwork OpenAI 表示,他们所做的一切并不能消除大型语言模型固有的“毒性”——GPT-3 接受了超过 GB 的网络文本训练,其中一些来自性别、种族、身体和宗教偏见社区,这放大了训练数据中的偏差。
回到 GPT-4chan,华盛顿大学博士生 Os Keyes 认为 GPT-4chan 是一个无聊的项目,不会带来任何好处:它会帮助我们提高对仇恨言论的认识,还是会让我们注重哗众取宠的人吗?我们需要提出有意义的问题。
例如,对于GPT-3的开发者来说,GPT-3在使用时受到(或不受到)怎样的限制,对于Yannic、Kilcher这样的人来说,在部署聊天机器人时他应该承担什么责任。
而Yannic和Kilcher坚称他只是一个YouTuber,他有与学者不同的道德准则。
▲ 图片来自:CNBC 不评论个人道德。
The Verge 记者 James Vincent 提出了一个发人深省的观点:2019 年,该公司的研发部门可能会在没有适当监管的情况下推出攻击性的 AI 机器人。
。
几年前,你根本不需要研发部门。
值得一提的是,不仅Yannic和Kilcher在研究4Chan,还有伦敦大学学院网络犯罪研究员Gianluca Stringhini等人。
面对Gianluca Stringhini的“仇恨言论”研究,4chan用户非常平静,并表示,“这只是给我们多了一个表情包。
”今天也是如此。
当GPT-4chan退役后,它使用的假地址“塞舌尔”成为4chan的新传奇。
版权声明:本文内容由互联网用户自发贡献,本站不拥有所有权,不承担相关法律责任。如果发现本站有涉嫌抄袭的内容,欢迎发送邮件 举报,并提供相关证据,一经查实,本站将立刻删除涉嫌侵权内容。
标签:
相关文章
06-18
06-18
06-18
06-17
06-18
06-18
06-21
最新文章
Android旗舰之王的过去与未来
智能手表不被开发、AR眼镜被推迟,Meta的产品经历了一波三折
为什么Cybertruck是特斯拉史上最难造的车?
更新鸿蒙3后,文杰允许你在车里做PPT了
新起亚K3试驾体验:追求“性价比”,韩系汽车仍不想放弃
阿维塔15登场!汽车配备了增程动力,理想情况下会迎来新的对手吗?
马斯克宣布创建 ChatGPT 竞争对手! OpenAI的CEO给他泼了冷水, GPT-5可能会发生巨大变化
骁龙无处不在,是平台也是生态