首页 > 科技未来 > 内容

数据显示,“农民工”月收入仅5000元,单价从5毛钱跌至4毛钱

发布于:2024-06-18 编辑:匿名 来源:网络

郑雯还记得几个月前的那个下午。

那天,她一小时赚了2分钱。

毕业于湖南某大专,大模型数据标注师。

她的日常工作并不复杂——为她收到的原始数据(如图像、视频、文本等)添加标签。

然而,大型模型对数据质量的要求非常高。

那天,一张照片修改了八次才被批准。

整个修改过程花了一个小时。

也就是说,她一个小时只赚20毛钱,而正常情况下她可以赚12块钱,所以她可以拉一个箱子。

“钱不容易赚。

”她反复强调。

这是几乎所有数据标注从业者的共识。

数据标注的一端承载着从业者月薪不足1元的工资,他们像蚂蚁大军一样搭建起大模型的基石。

另一端是各大互联网公司的AI梦想,他们希望超越Chat GPT 4。

数据标注采用最原始的计件制计算工资,职场中没有勾心斗角。

* 这项枯燥的工作让他们中的大多数人很难坚持三个月。

而且,几乎所有人都告诉Tech星球,你不应该去。

但他们不知道的是,他们中的大多数人可能很快就会失去无聊的工作。

因为那些简单的数据标注将会被AI所取代。

01 从5毛钱到4毛钱,价格暴跌。

林爽2018年赚了“快钱”:15天倍数。

对于大专毕业的林爽来说,这笔收入确实很可观。

彼时,人们对AI的期待值直线上升。

几乎没有人怀疑它的未来。

所有投资机构都坚信,这里可以诞生数十亿、数百亿、甚至千亿规模的企业。

几乎所有人工智能技术的背后都是算法、算力、算力的竞争。

海量数据是技术卓越的底层。

背景光鲜亮丽的程序员坐在“北上广”的办公室里,通过代码迭代算法绘制AI蓝图,而大学生、妈妈们等则在三、三地的小隔间里处理海量数据包中的图像、文本和语音。

四线城市。

等待。

ChatGPT 也不例外。

百度文心一言项目组的一名员工表示,大模型本身并没有什么新技术,也没有很高的技术壁垒。

关键问题是算力壁垒形成的参数壁垒。

大模型时代的数据注释器与过去并没有特别不同。

少数的区别可能是更舒适的办公环境和对注释质量的更高要求。

一位数据标注从业者告诉Tech星球,他们刚进入这个行业时,通常会组成一个10人左右的团队,其中一个负责质检。

如果工作不合格,员工将被送回重做。

数据的质量决定了大型模型的质量。

数据民工并不关心人工智能技术的任何新分支。

他们更关心单价,因为这里的工资是按件计算的。

“当时单价高的时候,一个2D帧就要1分钱多,巅峰时期,我工作10多个小时,一天就赚了1块多钱。

”林爽回忆道。

然而,这还不是最高的。

一位注释者表示,早期 2D 框架图的价格可能高达 50 美分。

画框是数据标注中的常用操作。

标注者根据要求标注图片中的物体,如车辆、红色路灯、障碍物等。

帧分为2D和3D,后者会更贵。

但这种流行并没有持续多久。

随着越来越多的人涌入以及AI行业整体发展的不顺利,标注一张图片的单价越来越低。

林爽说,现在价格只要4毛钱。

“如果是做框架,行业平均单价在0.15元左右,但还是要看项目。

如果自己能接单,接一手订单的首要条件应该是新员工。

规模相当大,3D帧可能每个要30美分,但很少达到50美分,“当然,如果你有医疗和金融领域的专业知识,单价会更高。

例如,许多大型医学模型需要注释者具有临床专业知识和相关经验。

大多数从业者的月收入不足1元,其中也不乏少数幸运儿。

数据显示,“农民工”月收入仅5000元,单价从5毛钱跌至4毛钱

杨硕原本在四川经营一家服装店,但疫情影响了他的生意。

今年,他转向大规模模型数据标注。

现在,他每月收入1万元。

“我和公司签了合同,支付了1000元。

加盟费,合同上写着*月收入为人民币。

” 0??2 谁赚钱?阿里、腾讯、字节等互联网巨头,以及上汽、领克等车企,都是收入来源数据标注业务分布,如果想要以最低的价格直接从源头获得订单,数据标注公司需要有一定的规模,一位数据标注公司的员工告诉Tech星球,他们直接从大工厂拿订单,但大工厂要求他们有人员,所以他们会选择通过特许经营或子公司来满足人员要求,两者的区别在于特许经营适合刚入行的人设立工作室。

设立子公司,一般一个地区只有一个,需要收取加盟费,一个子公司是一个地区的独家代理,需要缴纳5万的费用。

并能保证三年内有足够的订单,并负责三年内的技术培训。

这些工作室或子公司组成了一个庞大的工会,少则数百,多则数千。

上述数据标注公司的员工表示,大模型的流行再次将数据标注行业推向热潮,现在几乎每天都有人参观他们的公司。

但事实上,经营一家数据标签公司并不容易。

数据标注公司告诉你的是,这个行业前1到2个月很难做,因为员工需要一个磨练期。

前期只要5-8人就够了,就算是40多岁的大妈也没有问题。

对于数据标注公司或工作室来说,稳定性是最重要的因素。

然而,Tech星球接触到的标注员工,大多经常因为无聊而在3个月内光速离职。

新员工并不能立即投入实际操作。

人员流动率高的结果是数据标注的质量和周期不够稳定。

缺钱的妈妈们是数据标注工作室最青睐的人群。

“找兼职肯定不行,会有缺口,如果投资房租、电脑,就会亏本。

最好的办法就是让所有员工都工作。

”经营数据的魏明说。

注释工作室,告诉Tech星球。

大多数数据表明,公司的支付周期从3个月开始,最长可达半年,但他们需要按月向员工支付工资,这需要一定的财务储备。

“对于一个人来说,三个月就是一万。

” “张健曾经加入过很多工会,第一年,他们赶上了行业的爆发期,二维框架图的单价高达5毛钱,那一年,他的工会就赚了几万。

但到了第二年,情况却急转直下,标价单价变低,员工流动性加大,加上两个大项目一整年都没有解决,就损失了几十个。

“老板们都说了,短期内不会碰数据标注,”张健说,“他们目前正在跟上游打官司。

”这是一项利润较低的业务,海天瑞升是目前数据标注行业第一家主板上市公司,去年该公司营收2.63亿元,利润仅1万元,净利润率刚刚过万。

但今年上半年,公司因客户数量下降而陷入亏损。

03 依靠蚂蚁搬家的积累,OpenAI。

最终凭借其大规模语言对话模型能力脱颖而出,这些被称为数据工作者的普通人支持着 Sam Altman(OpenAI 创始人)的 AI 梦想,但如果不出意外的话,大部分工作都在他们手中。

很快就会被他们参与创建的新产品所取代,在国外,由 Open AI 前员工于 2001 年创立的 Anthropic 今年已筹集了 51.5 亿美元,是过去两年融资总额的七倍多。

该公司提供了一种减少人工参与的模型训练新方法。

今年,AI初创公司refuel推出了一款名为Autolabel的开源工具,可以使用市场上主流的大型模型来标记数据集。

该公司的测试结果表明,Autolabel的贴标效率是人工贴标的两倍,而成本仅为人工成本的1/7。

在中国,一家名为Vision Future的公司也在构建大规模注释模型。

他们在接受采访时表示,一些项目已经使用GPT进行交付,准确率达到了80%以上,接近手工作业。

不过,海天瑞盛认为,AI并不会实现完全自动化标注,因为机器想要继续进化,让其更加接近人类的判断和理解,肯定需要人类的指导。

几乎所有从事过数据标注的人都向Tech星球透露了同样的观点:数据标注是一个没有门槛的工作,只需要你熟练使用计算机即可。

但事实上,如果简单的标注可以用AI完成,那么人工参与将是更加困难的数据筛选和标准工作,这也意味着行业的门槛将不断提高,尤其是ChatGPT、文心一言等大型语言模型类。

作为对比,早在ChatGPT流行之前,OpenAI就组织了十几名博士生进行“标记”。

百度海口数据标注基地拥有数百名专职大模型数据标注员,标注员本科率达到50%。

这类大型语言模型的特点是标注者需要具备一定的知识储备和逻辑分析能力。

根据《财经十一人》报告,注释者需要确定问题的类型,然后分别对5个答案进行评分和排名。

评分范围为0-5分。

如果分数低于3分,必须注明具体原因,例如“答案不是所问问题”。

0分)”、“严重跑题(1分)”、“存在逻辑问题和事实错误,且比例较小给2分”等。

数据标注的另一个热门领域是自动驾驶。

据德勤报告显示,2020年自动驾驶领域的标注需求占整个AI下游应用的38%,预计到2020年这一比例将上升至52%。

与大型语言模型相比,对于模型来说,在自动驾驶领域,那些简单的拉箱子操作还是学术要求比较宽松的,标注者是人类从移动互联网时代到人工智能时代的基石,Tech星球接触到的从业者大多没有。

他们不知道AI会给他们带来什么改变,也不知道他们为AI的发展做出了哪些贡献,他们只是互联网时代的新一代螺丝钉,随时可能被取代。

(注:本文人物均为化名。

)【本文由投资界合伙人Tech星球授权。

本平台仅提供信息存储服务。

】如有任何疑问,请联系投资界()。

数据显示,“农民工”月收入仅5000元,单价从5毛钱跌至4毛钱

站长声明

版权声明:本文内容由互联网用户自发贡献,本站不拥有所有权,不承担相关法律责任。如果发现本站有涉嫌抄袭的内容,欢迎发送邮件 举报,并提供相关证据,一经查实,本站将立刻删除涉嫌侵权内容。

标签:

相关文章

  • 小鹏汽车宣布完成C+轮近5亿美元融资,高瓴、红杉等投资

    小鹏汽车宣布完成C+轮近5亿美元融资,高瓴、红杉等投资

    耀铭汽车宣布完成近5亿美元C+轮融资,高瓴资本、红杉资本等公司投资。 7月20日,耀明汽车正式宣布完成近5亿美元C+轮融资。 主要投资者为Aspex、Coatue、高瓴资本和红杉资本中国。 据悉,耀明汽车于今年11月完成C轮融资,获得何小鹏和小米集团4亿美元融资。 不久前,7月17日晚

    06-17

  • 金蝶云之家获A+轮融资,为大中型企业提供定制云服务

    金蝶云之家获A+轮融资,为大中型企业提供定制云服务

    据投资界12月29日消息,金蝶云之家宣布获得耀明资本A+轮融资。 今年6月,金蝶云之家获得新光集团数亿元A轮融资。 当时,云家发布了创新的移动办公场景V9。 V9可以帮助企业赋能个体,激活组织,让所有云之家用户成为超级个体。   本轮融资后,云智嘉将继续加强产品研发和渠

    06-18

  • 360 推广携手易车发布汽车行业报告,深度解读行业“潜规则”

    360 推广携手易车发布汽车行业报告,深度解读行业“潜规则”

    2019年4月25日,推广携手易车共同发布《年Q1汽车行业搜索报告》。 双方代表在车展现场直播中与广大车企分享了报告亮点,深入剖析了当前汽车行业发展现状,探讨了汽车行业营销推广的发展趋势和市场趋势。 汽车行业背后的数据。 中装与易车两大数据平台商易和易车指数在汽车垂

    06-18

  • 中国工业和信息化部:加快5G、工业互联网等新型信息基础设施建设和应用

    中国工业和信息化部:加快5G、工业互联网等新型信息基础设施建设和应用

    中新网 中国工业和信息化部部长金壮龙14日表示,要加快5G、工业互联网等新型信息基础设施建设和应用。 、做强数字经济核心产业,推动集成电路和工业软件产业高质量发展。 3月14日,金壮龙主持召开会议,传达学习贯彻全国两会精神,研究部署落实措施。 金壮龙要求加快实施“十

    06-06

  • 博克斯2020年实现收入1.17亿元,同比增长32.90%

    博克斯2020年实现收入1.17亿元,同比增长32.90%

    博克斯(00.OC)近日披露了上一年的“成绩单”。 公司年报显示,博克斯实现营业收入1.17亿元,同比增长32.90%;归属于上市公司股东的净利润4100元,同比增长0.97%。 听,中小企业反馈平台。 倾听用户的需求,倾听创业者的声音,解决中小企业的痛点。 点击立即参与调查并获得礼

    06-18

  • 《IDC 中国游戏云市场跟踪研究,2022H2》系列文章二:游戏云整体市场状况

    《IDC 中国游戏云市场跟踪研究,2022H2》系列文章二:游戏云整体市场状况

    中国游戏云整体市场分析 宏观行业判断:IDC对游戏云市场中短期的健康增长持积极态度。 只要不出现重大舆论风险,“常态化版号发行”将促进下游游戏市场的增长,并带动游戏云服务的使用量和游戏云市场规模长期持续增长。 学期。 疫情恢复的影响:疫情后终端用户在娱乐和生活方

    06-18

  • 我国最大集装箱超算中心在武汉建成,规划设计算力200P

    我国最大集装箱超算中心在武汉建成,规划设计算力200P

    长江日报 据长江日报报道,建成全国首个集人工智能和超算为一体的多元化云服务算力集群在武汉。 据介绍,武汉超级计算中心从立项到竣工,历时6个月,现已投入使用。 武汉超算中心是我国最大的集装箱超算中心,也是全国首个集人工智能和超算为一体的多元化云服务算力集群。 武

    06-06

  • 投资世界24小时 -滴灌又火了:员工带100万上班?刚刚,联合创始人辞去了OpenAI的职务;香港科技大学结束VC生涯

    投资世界24小时 -滴灌又火了:员工带100万上班?刚刚,联合创始人辞去了OpenAI的职务;香港科技大学结束VC生涯

    时间:2020年5月15日星期三重要消息:颜宁荣获世界杰出女科学家奖。 根据不确定性,联合国教科文组织和欧莱雅基金会于当地时间5月14日公布了2016年世界杰出女科学家奖的五位获奖者。 中国科学家颜宁是获奖者之一。 颁奖典礼将于5月28日举行。 (中新网)OpenAI联合创始人和首

    06-18

  • 一张图告诉你全球首例自动驾驶致命车祸是如何发生的

    一张图告诉你全球首例自动驾驶致命车祸是如何发生的

    背景介绍:美国公路交通安全委员会(NHTSA)发布公告称:5月7日,在佛罗里达州,一名车主在使用自动驾驶汽车时发生事故身亡。 他的Model S上的自动驾驶模式。 根据NHTSA的初步报告,当时在一个路口,特斯拉前面的一辆大型拖车在路口左转,但特斯拉的自动制动系统未能工作,可

    06-18

  • 该项核心技术落户临港新区,推动产业集群发展

    该项核心技术落户临港新区,推动产业集群发展

    该项核心技术 近日,该项核心技术上海临港总部正式落户临港新区。 上海临港总部作为该核心技术的研发总部和全球数据中心,集办公研发、数据中心、硬件仿真器于一体。 可以支持全球团队在任何地方进行芯片设计或软件构建,保证各种IT服务的可用性。 可靠稳定,同时通过集中管

    06-06

  • 北京:鼓励民营、外资企业、国有企业投资高精尖产业

    北京:鼓励民营、外资企业、国有企业投资高精尖产业

    创头条获悉,北京市人民政府近日发布的《北京市关于促进高精尖产业投资推进制造业高端智能绿色发展的若干措施》宣布《措施》鼓励民营、外资企业投资高精尖产业三资企业、国有企业等主体投资符合首都城市战略定位的高新技术产业。 《措施》指出,要营造良好营商环境,鼓励高精

    06-18

  • 诚电科技获得玖羚智能1000万元战略投资,

    诚电科技获得玖羚智能1000万元战略投资,

    据3月16日消息,诚电科技宣布获得玖羚智能1万元战略投资。 据悉,投资资金将全部用于市场补贴。 据了解,深圳市诚点科技有限公司是一家在酒店行业具有一定知名度的服务型、技术型公司。 公司开展多模式合作,针对不同的客户群体有不同的合作方式。 公司致力于用世界一流的技术

    06-17