首页 > 科技未来 > 内容

ChatGPT爆炸的背后，那些帮它“洗白”的人

发布于：2024-06-21 编辑：匿名来源：网络

人工智能的成功不仅仅归功于金字塔顶端的天才。

人工智能无法识别物体，需要大量数据来学习区分面部特征和交通信号灯。

人工智能接受所有信息，并依靠人类帮助它消除数据库中的有害部分。

当人工智能最终出现在聚光灯下时，数据注释者完成了他们单调而重要的职责，然后消失在黑暗中。

风靡全球的ChatGPT，大概就是一个“一将成功，万骨枯死”的故事。

ChatGPT的“幕后英雄” ChatGPT的强大程度不言而喻。

它可以用自然语言与你交谈、编写代码、写论文、通过考试、创作诗歌。

与之前的“人工减速”相比，ChatGPT的前身GPT-3也是一个很大的改进，但它有一个问题。

很容易脱口而出暴力、性别歧视和种族主义言论，因此无法真正普及。

吸取了过去的教训，为了确保ChatGPT温和无害，OpenAI建立了额外的安全机制。

▲ 图片来自：shutterstock 根据涉及暴力、仇恨和性虐待的内容示例，训练一个能够检测有害内容的 AI，然后使用这个 AI 作为检测器并将其内置到 ChatGPT 中，以阻止该内容到达用户手中。

起到检测和过滤的作用。

上面的例子需要数据标注，这是大量的人力劳动，由肯尼亚的工人负责标记有害内容。

从今年 11 月开始，OpenAI 向外包公司 Sama 发送了数万条文本片段，其中大部分反映了互联网最黑暗的角落，涉及性虐待、自杀、酷刑等。

▲ 图片来自：Sama 数据注释者开始在阅读不可接受和有害的内容后反复产生幻觉。

繁重的工作量并没有带来优越的待遇。

《时代周刊》调查发现，为 OpenAI 工作的 Sama 数据注释员每小时的工资约为 1.32 至 2 美元。

他们九小时轮班工作，阅读并注释最多段落的文本，每个段落的范围从一个单词到多个单词。

但 Sama 回应称，每 9 小时轮班注释 70 段的工人（而不是最多）税后每小时的收入在 1.46 至 3.74 美元之间。

Sama 还称自己是一家“有道德的人工智能公司”，已帮助超过 50,000 人摆脱贫困。

如果讲道德意味着帮助摆脱贫困，那么也许这并没有什么错，毕竟这些贫困工人没有更多的选择。

但“副作用”始终存在，身心的折磨成为必要的代价。

由于萨玛对员工工作效率要求极高，因此公司很少组织心理咨询活动，更何况这些活动本身用处不大。

一名员工曾要求进行一对一咨询，但多次遭到萨玛管理层的拒绝。

OpenAI 也对外媒 Quartz 做出回应，称他们支付的费用几乎是东非其他内容审核公司的两倍，并为员工提供福利和养老金。

虽然各方说法不同，但基本事实是一致的。

为了让AI更加安全，为了让OpenAI的通用AI造福人类，大量的工作者付出了巨大的努力，甚至遭受了创伤。

但当 OpenAI 估值接近 1 亿美元时，他们仍然默默无闻。

最后的毛细管数据注释器并不是什么新工作。

早在 2017 年，计算机视觉专家李飞飞就以每小时 10 美元的价格雇佣了一群普林斯顿大学的本科生来进行数据标注实验。

如今，数据标注已经发展成为一个行业，但薪资大幅下降，主角也不再是大学生。

大约在这个时候，有媒体报道了国内的数据标注员，他们分散在河南、山东、河北等地的四五线城镇。

同样，Sama 总部位于旧金山，在肯尼亚、乌干达和印度雇用员工。

除了OpenAI之外，它还为谷歌、Meta和微软等硅谷客户标记数据。

然而，这两年，萨玛下定决心，要金盆洗手。

今年2月，Sama决定终止与OpenAI的合作。

员工不再需要忍受痛苦，但生计也难以维持。

“对我们来说，这是养家糊口的一种方式。

”今年1月，Sama更加果断，计划退出所有自然语言处理和内容审核工作，只做计算机视觉数据标注，并与所有涉及敏感内容的业务分道扬镳，包括终止与东非Meta的合同。

在非洲内罗毕办事处为 Meta 工作的 Sama 员工专注于审核本地制作的内容，发现斩首、虐待儿童等超出他们舒适区的内容。

一名员工将查看图像内容描述为“生活在恐怖电影中”。

有需求就有市场，不乏这样的外包公司。

据报道，负责 TikTok 在非洲审核服务的卢森堡外包公司 Majorel 已准备接手 Meta 的工作。

该公司也受到了一些批评。

2019年8月，Insider调查了摩洛哥Majorel的情况，发现工人们经常轮班工作超过12小时，被贴上涉及虐待动物、性暴力等的标签，而且休息时间比美国同行少。

公司的“健康顾问”也帮无事可做。

作为科技产业链末端的毛细血管，数据标注也出现在更多的地方。

去年 11 月，The Verge 报道称，亚马逊在印度和哥斯达黎加雇佣了工人，通过观看仓库摄像机的数千个视频来改进其计算机视觉系统。

▲ 图片来自：路透社但因为至少八个小时无法转动眼睛，他们出现了头痛、眼睛疼痛和视力丧失的症状。

自动驾驶汽车还需要数据注释来学习如何识别路标、车辆、行人、树木和垃圾桶。

它对注释的准确性要求更高，因为它可能直接决定一个人的生死。

2019 年 4 月的一项调查发现，包括特斯拉在内的自动驾驶公司平均每小时向委内瑞拉工人支付 90 美分多一点的工资来注释自动驾驶数据。

至少目前来说，数据库仍然需要人类去净化，AI图像识别仍然需要人类去画框。

问题是，与付出的努力相比，工人们的待遇和心理健康状况并不理想。

自从ChatGPT出现以来，许多越来越边缘化的人开始担心自己的工作。

这可能是一种非常具体的危机感。

与此同时，人工智能与人类的关系也在另一个维度发生了微妙的变化——它改变了人类的工作方式和存在的工作类型，让大量的劳动力隐藏在幕后。

例如，对于数据标注员来说，他们的工作门槛并不高，往往没有硬性的学历要求。

ChatGPT爆炸的背后，那些帮它“洗白”的人

经过几天的培训，他们就可以开始工作了。

一旦你知道了要标记什么以及标记在哪里，那么你基本上就已经入门了，剩下的时间就留给练习以求完善。

他们通常不是正式员工，而是外包的，就像为 OpenAI 工作的肯尼亚工人一样。

这意味着他们生活在一个更加不稳定的世界，工资更低，地位更边缘，在工作场所的发言权更少。

他们只是追随潮流。

他们可能不知道人工智能进展到什么程度。

2016年，《GQ》在《那些给人工智能打工的人》报道：“我们没有研发能力，我们只是一个（合约）富士康”。

▲勒德运动。

历史上也曾上演过类似的情况。

19世纪初的英国，自动化纺织机变得司空见惯，工厂更愿意雇佣廉价、非熟练劳动力来操作机器，导致许多熟练体力工人失业。

时代的车轮不断前进，为AI服务的数据标注者也慢慢被AI取代。

6月，特斯拉计划解雇两名负责视频注释的美国员工，以帮助改进驾驶员辅助系统。

原因可能是特斯拉的自动化数据标注近年来取得了进步，可以替代人类完成的部分工作。

特斯拉 Autopilot 软件总监曾在 AI Day 上表示，该公司可以在一周内收集并自动标记 10,000 个 45 至 60 秒的视频片段。

相比之下，“手动标记每个片段可能需要几个月的时间。

”2009年，世界经济论坛预测，到2019年，将有1万个工作岗位被机器取代，并创造1万个新工作岗位。

他们看好的职位基本都是人工智能和机器学习专家、数字化转型专家、信息安全分析师等技术人才。

相比之下，低收入、低技能的职业正在逐渐退出舞台，并可能最终消失在机器的阴影中。

站长声明

标签：

上一篇：VAIO SX12新品体验：小而美、轻薄、全能

下一篇：为什么拍照优秀的安卓手机大多都是同一个核心？

今年以来，美国科技行业已裁员5万多人； Ideal MEGA的订单远低于预期；阿里巴巴否认盒马大润发将出售给中粮

Ideal MEGA 目前的实际订单与预期相差甚远。 3月17日消息，据LatePost报道，理想公司预计24小时内MEGA订单量在1000台左右，但最终结果未达预期，只实现了目标的一半。 MEGA宣布半个月内已接到近台湾订单，本月MEGA产能为台湾。 “销量离目标还很远。 ” 据理想内部人士透露，

06-17
月泉仿生完成数千万天使轮融资

据投资界（ID：pedaily）8月14日消息，大旗月泉仿生科技表示，以“源于自然、科技创新领军企业北京大旗悦泉仿生科技有限公司（以下简称“悦泉仿生”）近日成功完成天使轮融资。本轮投资方为北京中关村发展集团启航投资（以下简称“启航仿生”）。融资所得将用于推动高自由通

06-17
良品铺子：一季度净利润1.02亿元，签约新店28家，

良品铺子（19.SH）发布一季度报告。一季度实现营业收入25.74亿元，同比增长34.83%；实现归属于上市公司股东的净利润1.02亿元，同比增长16.06%。

06-18
世界上第一个活体机器人诞生：可编程、自愈、由超级计算机设计

科学家创造了世界上第一个由青蛙干细胞产生的活体自愈机器人。当地时间1月13日，佛蒙特大学在其官网发布新闻稿，宣布佛蒙特大学和塔夫茨大学的研究团队联合利用非洲爪蟾早期胚胎中的基因进行研究。皮肤细胞和心脏细胞创造了第一个活体机器人，称为异种机器人。该研究于1月

06-17
“碳平衡科技”完成千万级天使轮融资，元和本源领投

投资社区（ID：pedaily）2月11日，碳中和数字解决方案服务商“碳平衡科技”宣布已获得数据千万元天使轮融资，由元和元电领投。此前，去年8月，碳平衡科技获得了饿了么联合创始人汪渊的种子轮融资。新一轮融资将主要用于团队发展、产品迭代和市场开拓。上海碳平衡科技有限公

06-18
哈尔滨：“共和国长子”的冰与火

作为马背上民族的发源地，哈尔滨是一座只有几年近代历史的“没有城墙的城市”。 2000年，俄罗斯在东北地区修建中东铁路，哈尔滨获得了建城历史机遇。 20世纪50年代，因为一位领导人的一句话，从北方冰城摇身一变，成为“共和国长子”。随着时代的变迁，哈尔滨的面貌不断被重

06-18
知识库大模型：未来智能的核心驱动力

.wp-block-column h3{margin-left:0} 在这个快速发展的数字时代，知识库大模型已经成为技术创新的前沿。这些模型不仅仅是数据的集合，它们代表了人工智能的未来，是机器学习和深度学习领域的重要里程碑。智能的核心是大知识库模型，通过整合海量数据和复杂算法，提供前所未

06-17
苏州洪芯完成数千万Pre-A轮融资，中芯资本领投

投资界（ID：pedaily）10月10日消息，多线程DSP处理器设计公司苏州洪芯完成数十轮融资数百万Pre-A轮融资，本轮融资由中信资本领投。本轮募集资金将主要用于产品研发和公司运营。苏州洪芯成立于2018年12月，公司总部位于苏州，主要从事DSP处理器和SOC芯片的研发、设计和销售

06-18
甘李药业抢IPO，启明创投医疗投资迎来收获期，合伙人梁颖宇董事独家解读医疗投资长周期背后的奥秘

进入新的一年，启明创投在医疗健康领域的投资逐渐迎来收获期。　　5月25日，甘力药业发布上市招股书。招股说明书显示，本次IPO拟募集资金15亿元。甘李药业创始人甘忠如直接和间接持有所控制公司股份合计44.46%；甘李员工持有的旭特宏达持有甘李药业9.4%的股份；香港启明创

06-17
谷歌正式公布3款新设备，此前多轮泄密均已得到证实

今年手机行业有两大奇迹。一是华为Mate 60系列将在没有任何公告或发布会的情况下开售，二是Pixel 8系列将在前几个月正式发布。一些用户对此开玩笑说：“人的一生中有三件事是不可避免的：死亡、税收和谷歌硬件泄露。 ”当然，谷歌可能不会像华为那样“标新立异”。即使产品

06-21
「亿嘉达」完成数千万元Pre-A轮融资，专注泌尿及盆底健康领域

投资界（ID：pedaily）10月20日消息，近日，亿嘉达医疗科技（上海）有限公司（以下简称“亿嘉达”）完成数千万元Pre-A轮融资。本轮融资由辰德资本领投，朗玛峰创投和老股东华创资本跟投，普万资本担任财务顾问。本轮融资将用于亿嘉达泌尿及盆底健康产品的持续创新、临床研究

06-18
苹果是如何走出iPhone销售危机的？

和往常一样，在微软、亚马逊、谷歌相继发布财报后，苹果公司截至2020年9月28日的Q4财季财报却迟迟在10月30日传来。（雷锋网注：财报季度与自然季节不同）本次财报营收超出市场预期。财报一出，苹果股价在盘后交易中上涨近2%，市值稳定在万亿美元以上。苹果首席执行官蒂姆库

06-18