首页 > 科技未来 > 内容

数据显示,“农民工”的月收入只有5000元,单价从5分钱降到了4分钱

发布于:2024-06-18 编辑:匿名 来源:网络

郑文依然感觉还记得几个月前的那个下午。

那天,她一小时赚了2分钱。

毕业于湖南某大专,大模型数据标注师。

她的日常工作并不复杂——为她收到的原始数据(如图像、视频、文本等)添加标签。

然而,大型模型对数据质量的要求非常高。

那天,一张照片修改了八次才被批准。

数据显示,“农民工”的月收入只有5000元,单价从5分钱降到了4分钱

整个修改过程花了一个小时。

也就是说,她一个小时只赚20毛钱,而正常情况下她可以赚12块钱,所以她可以拉一个箱子。

“钱不容易赚。

”她反复强调。

这是几乎所有数据标注从业者的共识。

数据标注的一端承载着从业者月薪不足1元的工资,他们像蚂蚁大军一样搭建起大模型的基石。

另一端是各大互联网公司的AI梦想,他们希望超越Chat GPT 4。

数据标注采用最原始的计件制计算工资,职场中没有勾心斗角。

* 这项枯燥的工作让他们中的大多数人很难坚持三个月。

而且,几乎每个人都告诉 Planet Tech,不要去。

但他们不知道的是,他们中的大多数人可能很快就会失去无聊的工作。

因为那些简单的数据标注将会被AI所取代。

01 从5毛钱到4毛钱,价格暴跌。

林爽2018年赚了“快钱”:15天倍数。

对于大专毕业的林爽来说,这笔收入确实很可观。

彼时,人们对AI的期待值直线上升。

几乎没有人怀疑它的未来。

所有投资机构都坚信,这里可以诞生数十亿、数百亿、甚至千亿规模的企业。

几乎所有人工智能技术的背后都是算法、算力、算力的竞争。

海量数据是技术卓越的底层。

背景光鲜亮丽的程序员坐在“北上广”的办公室里,通过代码迭代算法绘制AI蓝图,而大学生、妈妈们等则在三、三地的小隔间里处理海量数据包中的图像、文本和语音。

四线城市。

等待。

ChatGPT 也不例外。

百度文心一言项目组的一名员工表示,大模型本身并没有什么新技术,也没有很高的技术壁垒。

关键问题是算力壁垒形成的参数壁垒。

大模型时代的数据注释器与过去并没有特别不同。

少数的区别可能是更舒适的办公环境和对注释质量的更高要求。

一位数据标注从业者告诉Tech星球,他们刚进入这个行业时,通常会组成一个10人左右的团队,其中一人负责质量检验。

如果工作不合格,员工将被送回重做。

数据的质量决定了大型模型的质量。

数据民工并不关心人工智能技术的任何新分支。

他们更关心单价,因为这里的工资是按件计算的。

“当时单价高的时候,一个2D帧就要1分钱多,巅峰时期,我工作10多个小时,一天就赚了1块多钱。

”林爽回忆道。

然而,这还不是最高的。

一位注释者表示,早期 2D 框架图的价格可能高达 50 美分。

画框是数据标注中的常用操作。

标注者根据要求标注图片中的物体,如车辆、红色路灯、障碍物等。

帧分为2D和3D,后者会更贵。

但这种流行并没有持续多久。

随着越来越多的人涌入以及AI行业整体发展的不顺利,标注一张图片的单价越来越低。

林爽说,现在价格只要4毛钱。

“如果是做框架,行业平均单价在0.15元左右,但还是要看项目。

如果自己能接单,接一手订单的首要条件应该是新员工。

规模相当大,3D帧可能每个要30美分,但很少达到50美分,“当然,如果你有医疗和金融领域的专业知识,单价会更高。

例如,许多大型医学模型需要注释者具有临床专业知识和相关经验。

大多数从业者的月收入不足1元,其中也不乏少数幸运儿。

杨硕原本在四川经营一家服装店,但疫情影响了他的生意。

今年,他转向大规模模型数据标注。

现在,他每月收入1万元。

“我和公司签了合同,支付了1000元。

加盟费,合同上写着*月收入为人民币。

” 0??2 谁赚钱?阿里、腾讯、字节等互联网巨头,以及上汽、领克等车企,都是收入来源数据标注业务分布,如果想要以最低的价格直接从源头获取订单,数据标注公司需要有一定的规模,一位数据标注公司的员工告诉Tech星球,他们直接从各大厂商那里获取订单,但各大厂商要求他们有人员,所以他们会选择通过特许经营或子公司来满足人员要求,两者的区别在于特许经营适合刚入行的人设立工作室。

设立子公司,一般一个地区只有一个,需要收取加盟费,一个子公司是一个地区的独家代理,需要缴纳5万的费用。

并能保证三年内有足够的订单,并负责三年内的技术培训。

这些工作室或子公司组成了一个庞大的工会,少则数百,多则数千。

上述数据标注公司的员工表示,大模型的流行再次将数据标注行业推向热潮,现在几乎每天都有人参观他们的公司。

但事实上,经营一家数据标签公司并不容易。

数据标注公司告诉你的是,这个行业前1到2个月很难做,因为员工需要一个磨练期。

前期只要5-8人就够了,就算是40多岁的大妈也没有问题。

对于数据标注公司或工作室来说,稳定性是最重要的因素。

然而Tech星球接触到的大多数标注员工,往往会因为无聊而在3个月内光速离职。

新员工并不能立即投入实际操作。

人员流动率高的结果是数据标注的质量和周期不够稳定。

缺钱的妈妈们是数据标注工作室最青睐的人群。

“找兼职肯定是不可能的,会有缺口,如果投资房租、电脑,就会亏本。

最好的办法就是让所有员工都工作。

”经营一家数据公司的魏明说。

注释工作室告诉Tech星球。

大多数数据表明,公司的支付周期从3个月开始,最长可达半年,但他们需要按月向员工支付工资,这需要一定的财务储备。

“对于一个人来说,三个月就是一万。

” “张健曾经加入过很多工会,第一年,他们赶上了行业的爆发期,二维框架图的单价高达5毛钱,那一年,他的工会就赚了几万。

但到了第二年,情况却急转直下,标价单价变低,员工流动性加大,加上两个大项目一整年都没有解决,就损失了几十个。

“老板们都说了,短期内不会碰数据标注,”张健说,“他们目前正在跟上游打官司。

”这是一项利润较低的业务,海天瑞升是目前数据标注行业第一家主板上市公司,去年该公司营收2.63亿元,利润仅1万元,净利润率刚刚过万。

但今年上半年,公司因客户数量下降而陷入亏损。

03 依靠蚂蚁搬家的积累,OpenAI。

最终凭借其大规模语言对话模型能力脱颖而出,这些被称为数据工作者的普通人支持着 Sam Altman(OpenAI 创始人)的 AI 梦想,但如果不出意外的话,大部分工作都在他们手中。

很快就会被他们参与创建的新产品所取代,在国外,由 Open AI 前员工于 2001 年创立的 Anthropic 今年已筹集了 51.5 亿美元,是过去两年融资总额的七倍多。

该公司提供了一种减少人工参与的模型训练新方法。

今年,AI初创公司refuel推出了一款名为Autolabel的开源工具,可以使用市场上主流的大型模型来标记数据集。

该公司的测试结果表明,Autolabel的贴标效率是人工贴标的两倍,而成本仅为人工成本的1/7。

在中国,一家名为Vision Future的公司也在构建大规模注释模型。

他们在接受采访时表示,一些项目已经使用GPT进行交付,准确率达到了80%以上,接近手工作业。

不过,海天瑞盛认为,AI并不会实现完全自动化标注,因为机器想要继续进化,让其更加接近人类的判断和理解,肯定需要人类的指导。

几乎所有从事过数据标注的人都向Tech星球透露了同样的观点:数据标注是一个没有门槛的工作,只需要你熟练使用计算机即可。

但事实上,如果简单的标注可以用AI完成,那么人工参与将是更加困难的数据筛选和标准工作,这也意味着行业的门槛将不断提高,尤其是ChatGPT、文心一言等大型语言模型类。

作为对比,早在ChatGPT流行之前,OpenAI就组织了十几名博士生进行“标记”。

百度海口数据标注基地拥有数百名专职大模型数据标注员,标注员本科率达到50%。

这类大型语言模型的特点是标注者需要具备一定的知识储备和逻辑分析能力。

根据《财经十一人》报告,注释者需要确定问题的类型,然后分别对5个答案进行评分和排名。

评分范围为0-5分。

如果分数低于3分,必须注明具体原因,例如“答案不是所问问题”。

0分)”、“严重跑题(1分)”、“存在逻辑问题和事实错误,且比例较小给2分”等。

数据标注的另一个热门领域是自动驾驶。

据德勤报告显示,2020年自动驾驶领域的标注需求占整个AI下游应用的38%,预计到2020年这一比例将上升至52%。

与大型语言模型相比,对于模型来说,在自动驾驶领域,那些简单的拉箱子操作还是学术要求比较宽松的,标注者是人类从移动互联网时代到人工智能时代的基石,大多数Tech星球接触过的人都没有。

他们只是互联网时代的新一代螺丝钉,随时可能被取代。

(注:本文人物均为化名)【本文由投资界合伙人Tech星球授权。

本平台仅提供信息存储服务。

】如有任何疑问,请联系投资界()。

数据显示,“农民工”的月收入只有5000元,单价从5分钱降到了4分钱

站长声明

版权声明:本文内容由互联网用户自发贡献,本站不拥有所有权,不承担相关法律责任。如果发现本站有涉嫌抄袭的内容,欢迎发送邮件 举报,并提供相关证据,一经查实,本站将立刻删除涉嫌侵权内容。

标签:

相关文章

  • 2018年,全球半导体资本支出将首次突破1000亿美元

    2018年,全球半导体资本支出将首次突破1000亿美元

    IC Insights将年度资本支出增长归因于“中国效应”。 近期,长江存储、华力、中芯国际等设备陆续搬入,也算是一个注脚……受益于半导体行业仍处于周期高端,市场研究机构IC Insight的调查报告指出,2020年全球半导体行业的资本支出将首次突破1000亿美元大关。 报告称,2020年

    06-06

  • 全球3D机器人视觉公司微链视觉完成数千万元Pre-A轮融资

    全球3D机器人视觉公司微链视觉完成数千万元Pre-A轮融资

    投资界(ID:pedaily)7月26日报道,据内部人士透露,全球3D机器人视觉领军企业“微链视觉”愿景”Pre-A轮融资已完成,融资金额达数千万元。 本轮融资由中央传媒旗下基金华民投资领投,水木清泉、深圳恒州信跟投。 本轮融资将用于进一步提升3D机器人视觉引导、深度学习和成像

    06-18

  • Azure Power 为印度 600 兆瓦太阳能发电厂提供购电协议

    Azure Power 为印度 600 兆瓦太阳能发电厂提供购电协议

    印度太阳能发电商 Azurepower Global Ltd 已为印度兆瓦级并网光伏 (PV) 项目签署购电协议 (PPA)。 与印度太阳能公司 (SECI) 的合同支持计划是根据与制造能力相关的 4GW 项目投标而授予的。 该机构将以每千瓦时 2.54 卢比(0.0 美元/0.0 欧元)的固定价格购买太阳能,为期 25

    06-08

  • 入睡前看屏幕可以带来更好的睡眠体验吗?这项新研究可能会改变我们的认识

    入睡前看屏幕可以带来更好的睡眠体验吗?这项新研究可能会改变我们的认识

    一天二十四小时,人们将近三分之一的时间都在睡觉。 如果我们不能通过睡眠得到良好的休息,我们的身体也会出现问题。 然而,世界上近三分之一的人口存在睡眠时间不足和睡眠质量差的问题。 它让本该放松的睡眠时间变得更加痛苦。 如果您搜索“如何提高睡眠质量?”你会得到大

    06-21

  • 京东仓储REIT武汉项目完成5年续租

    京东仓储REIT武汉项目完成5年续租

    1月4日,京东仓储REIT(基金代码:98)宣布,京东仓储REIT底层资产之一的武汉项目已顺利完成5年续租。 年租约续签。 周期更新。 公开资料显示,京东仓储REIT目前共持有3个底层资产,分别是重庆项目、武汉项目和廊坊项目。 武汉项目位于武汉空港经济开发区,是全国物流网络的关

    06-18

  • 微软发布会六大新品,折叠电脑、折叠手机初次亮相

    微软发布会六大新品,折叠电脑、折叠手机初次亮相

    微软推出六款新品,折叠电脑、折叠手机首次亮相2019年10月2日,微软在纽约召开Surface新品发布会。 此前,微软声称本次大会将带来“新的、创新的东西”。 那么,微软在本次大会上发布了哪些硬件产品呢?雷锋网带你一探究竟。 Surface Laptop 3:全新模块化设计,拆装方便。 第

    06-18

  • 硅基仿生获近5亿元D轮融资,加速血糖管理模式数字化升级

    硅基仿生获近5亿元D轮融资,加速血糖管理模式数字化升级

    据投资界(ID:pedaily)12月21日消息,近日,深圳硅基仿生科技芯科仿生科技股份有限公司(以下简称“芯科仿生”)“基芯仿生”)获得近5亿元D轮融资。 本轮融资由上海生物医药基金和广东省中医健康基金联合领投,兴证资本、嘉诚资本、中国新城等机构参与,方圆资本担任企业

    06-17

  • 博雷顿完成数亿元C轮融资 -钟鼎生态

    博雷顿完成数亿元C轮融资 -钟鼎生态

    近日,博雷顿科技有限公司完成数亿元C轮融资,由星航资本、合肥仁顿及耀明投资、中集车辆、上海科投共同领投,有限公司、科盛资本、中地资本共同投资。 本轮融资将主要用于产品研发、市场拓展、生产基地和销售体系拓展。 钟鼎资本自2006年开始投资博雷顿,持续关注新能源应用

    06-18

  • 易居中国确认IPO发行价13.8美元,融资2亿美元

    易居中国确认IPO发行价13.8美元,融资2亿美元

    8月8日下午消息,国内首只房地产经纪概念股——易居中国(NYSE:EJ)今天确认IPO (首次公开发行)发行价格为13.8美元,超出此前11.5美元至13.5美元的发行价格区间。 易居中国定于今晚在纽约证券交易所挂牌上市,发行10,000股美国存托股票(ADS),募集资金2.01亿美元。   易

    06-18

  • 新加坡共享单车oBike完成4500万美元B轮国际融资,分享高燃海外战绩

    新加坡共享单车oBike完成4500万美元B轮国际融资,分享高燃海外战绩

    据投资界8月17日消息,新加坡首家无桩智能共享单车公司oBike宣布已完成10,000美元B轮融资。 一轮国际融资。 本轮投资方包括出行平台、董事长和创始人德米特里格里申(Dmitry Grishin)旗下的Grishin Robotics以及东南亚各大家族。    据了解,自今年1月成立以来,oBike已进

    06-18

  • 贝塔斯曼集团收购BMG私募巨头全部股份 KKR退出

    贝塔斯曼集团收购BMG私募巨头全部股份 KKR退出

    据投资界3月4日消息,贝塔斯曼集团与KKR集团3月1日联合宣布,通过收购全球最大私募股权公司之一KKR国际媒体集团贝塔斯曼将通过持有的股份全面收购创新音乐版权管理公司BMG,并使其成为全资子公司。 该交易正在相关机构审批中,预计将于今年上半年完成。   贝塔斯曼集团首席

    06-17

  • 亚马逊自研芯片背后的大趋势

    亚马逊自研芯片背后的大趋势

    亚马逊网络服务上个月扩大了其芯片业务,主要是这家云提供商巨头推出了第三代基于Arm的Graviton处理器,该处理器将为计算密集型的新云实例提供动力高性能计算 (HPC)、科学建模、分析和基于 CPU 的机器学习推理等工作负载。 在 AWS 的 re:Invent 大会上,该公司推出了目前处于

    06-08