AI大模型折叠:数据显示“农民工”月收入不超过5千,单价从5毛钱跌到4毛钱

AI大模型折叠:数据显示“农民工”月收入不超过5千,单价从5毛钱跌到4毛钱

图片来历:由无界 AI生成

郑雯至今觉得记住几个月的下午,那天,她一个小时就赚了2毛钱。她毕业于湖南的一所专科学校,是一名大模型数据标示师,每天的作业并不复杂——给自己领取的原始数据(如图画、视频、文本等)添加标签。

但大模型关于数据的质量要求很高,那天当时一张图片被要求反复修正了8次才经过,整个修正进程花费了一个1小时。也就是说,她这一个小时只赚了2毛钱,而正常情况下能够赚到12块,能够拉600个框。“钱并不好赚”,她反复强调。

这简直是一切数据标示从业者的共识。数据标示的一端承载着从业者们缺乏5000元的月薪,他们如蚂蚁雄兵般构建起大模型的柱石。而另一端则是互联网大厂们的AI梦想,他们期望借此超越Chat GPT 4。

数据标示选用最原始的计件制算工资,并不存在职场上的明争暗斗。唯一的苦恼这份过于单调的作业,让他们中的大部分很难坚持完3个月。并且,简直一切人都告知Tech星球,你最好别去。

可他们不知道的是,要不了多久,他们中的大部分或许会失掉这份单调的作业。由于,那些简略的数据标示将会被AI取代。

从5毛到4分,价格暴跌

林双在2017年赚到了一笔“快钱”:15天6000多元。关于专科毕业的林双来说,这个收入着实可观。那是人们对AI期望爆棚的时候,简直没有人置疑过它的未来,一切的投资机构都深信这里能够诞生十亿、百亿乃至千亿规划的企业。

简直一切AI技能的背面都是算法、算力、算据的竞赛,巨大的数据是技能好坏的底层。布景光鲜的程序员们坐在“北上广”的作业室里,经过代码迭代算法描绘AI蓝图,而大专生、宝妈等在三四线城市的格子间处理巨大数据包中的图片、文字、语音等。

ChatGPT也不例外。一位百度文心一言项目组的职工称,大模型自身并没有什么新技能,也没有太高的技能壁垒,关键的问题是算力壁垒构成的参数壁垒。

大模型年代的数据标示员和以前的也并没有特别大差异,为数不多的距离或许是愈加舒适的作业环境和对标示质量的更高要求。一位数据标示的从业者向Tech星球介绍,一般刚刚入行时,他们会组成一个10人左右的团队,这其间有一个人承担质检作业,假如不合格,就要职工打回去重做。而数据的质量则决定着大模型的好坏。

数据民工们也并不关心,AI技能又有什么新的分支,他们更在意的是单价,由于这里是计件算工资。

“那会儿单价高的时候,拉一个2D框就有1毛多,我最高的时候干了10多个小时,一天就赚了600多元”,林双回想道。不过,这不是最高的,一位标示人员称,前期2D拉框的价格最高能到达5毛钱。

拉框是数据标示中常见的一种操作,标示员依据要求对图片中的物体,如车辆、红路灯、障碍物等画框标示。拉框分为2D和3D,后者的价格会更贵一些。

但这种热度并没有继续多少,伴随着越来越多人涌入以及AI职业全体开展的不够顺畅,标示一个图片的单价越来越低,林双称现在最低的只要4分钱。

“假如是拉框,职业的均匀单价是在0.15元左右,但仍是要看项目,假如自己能够接到单,接到一手单的最低要求应该是100个入职职工,那规划挺大,3D的框有或许到达3毛钱一个,不过很少能够有到达5毛的。”

当然,假如你自身具有医疗、金融方面的专业知识,那么单价则会更高。比方,很多医疗大模型会要求标示员有是临床专业,且有相关从业经验。

大部分从业者每个月的收入都不过5000元,其间也不乏少量的幸运儿。杨硕本来在四川运营一家服装店,但疫情影响了他的生意,他在本年转型做大模型数据标示,现在,他每个月有8000元收入,“我是和公司签了合同,交了9500元的加盟费,合同里写着每个月最低收益是7000元。”

终究谁赚到了钱

阿里、腾讯、字节这样的互联网大厂,以及上汽、领克等车企是数据标示业务分发的源头,想要以最好的价格直接从源头获取订单,数据标示公司们需求具有必定的规划。

一位数据标示公司职工对Tech星球称,他们直接从大厂拿到订单,可是大厂要求他们得有500人,因此他们会挑选经过加盟或许子公司的办法来到达人员要求。

二者的差异是加盟适用于初入行的人组成作业室,假如要成立子公司,一般一个区域就只要一家。小白作业室需求收加盟费,2.5万或许3万。子公司是一个区域的独家代理商,需求交纳5万费用。而他们能够三年以内保证订单的足够,并负责3年内的技能培训,这些作业室或许子公司们组成一个大的工会,几百到几千不等。

上述数据标示公司职工称,大模型的火热再次将数据标示职业推上热潮,现在简直每天都有人去他们公司拜访。

但事实上,运营一个数据标示公司并不容易。数据标示公司告知你的是,这个职业前1到2个月比较难做,由于职工需求爬坡期,前期只需求5-8个人就够了,40多岁的阿姨都没有问题的。

稳定是数据标示公司或许作业室最重要的因素。可是Tech星球接触的大部分标示职工往往都由于单调无趣在3个月内“光速”离职,新职工并不是立刻能够到岗实操,人员流动性大的成果就是数据标示的质量和周期不够稳定。缺钱的宝妈是数据标示作业室最喜欢招纳的人群。

“找兼职必定不行的,会有空档期,房租和电脑投入了,会亏钱,最好的办法是全员坐班”,开过数据标示作业室的人魏铭向Tech星球介绍。

大部分数据标示公司的回款周期是3个月起步,最多半年,但他们需求以月付的办法给职工工资,这需求必定程度的资金储藏,“一个人3500,100个人,3个月就是105万。”

张建从前加入过一个又200多号职工的工会。第一年,他们赶上职业的爆发期,2D拉框的单价高达5毛,那一年他所在的工会赚了400多万。

可是第二年,行情扶摇直上。标示的单价变低,职工的流动性更快,空档期增加,再加上两个大项目都没有结算,一整年过去,他们亏了300多万。“老板都说短时间内坚决不碰数据标示”,张建表明,“他们现在正在和上游打官司。”

这是赢利菲薄的生意。海天瑞声是现在数据标示职业界首家主板上市公司,去年这家公司有2.63亿元营收,赢利只要2945万元,净赢利率刚刚超过10%。但本年上半年,由于客户数量削减,这家公司便陷入了亏本。

随时或许被替代的“螺丝钉”

依靠着肯尼亚工人蚂蚁搬家式的积累,最终OpenAI的言语对话大模型才能脱颖而出。这些被称为数据民工的普通人支撑起了山姆·奥特曼(OpenAI创始人)的AI梦,但假如不出意外,他们手中的大部分作业,很快就会被自己参加创造的新产品所取代。

在国外,Open AI 前职工于2021年成立的Anthropic本年现已融资51.5亿美元,是其过去两年融资总额的7倍还多。这家公司提供了一种新的办法,可在较少人工参加的情况下,便训练出模型。

本年,AI草创公司refuel推出了一个名为Autolabel的开源工具,能够运用市面上主流的大模型来对数据集进行标示。该公司的测试成果称,Autolabel的标示功率比较人工标示提高了100倍,成本仅为人工成本的1/7。

在国内,一家名为视智未来的公司也在打造标示大模型。他们在接受采访时表明,有些项目现已用GPT交付了,准确率方面到达了80%多,与人工接近。

不过,海天瑞声认为,AI必定不会完成彻底的自动化标示,由于机器假如想要继续演进,使其更接近于人类的判别和理解,就必定需求人类作为引导。

简直一切从事过数据标示的人员,都向Tech星球透露着同一个观念:数据标示是一个没有门槛的作业,只需求你娴熟运用电脑即可。

但事实上,假如简略的标示能够用AI来完成,那么人工参加的将是难度更高的数据挑选和标准作业,这也意味着职业的门槛将会不断提高,尤其是ChatGPT、文心一言类的大言语模型。

作为对照,早在ChatGPT走红前,OpenAI就组成十几位博士生来“打标”。而百度在海口的数据标示基地具有数百名专职大模型数据标示师,标示师的本科率到达100%。

这类大言语模型的特点是,标示员需求具有必定的知识储藏和逻辑分析才能。依据《财经十一人》报导,标示师们需求判别问题类型,随后给5个回答分别打分并排序,分数区间为0-5分,假如打分低于3分,还要标示出详细原因,例如“答非所问(0分)”、“严峻跑题(1分)”、“存在逻辑问题,存在事实性错误,份额较小给2分”等。

数据标示的另一个热门范畴是自动驾驶。据德勤的报告显现,2022年自动驾驶范畴的标示需求占整个AI下游使用的38%,估计到2027年,份额将上涨到52%。相较于大言语模型,关于自动驾驶范畴的模型而言,那些简略的拉框操作仍然有着较为宽松的学历要求。

标示员们是人类从移动互联网年代到人工智能年代的柱石,Tech星球接触到的大部分从业者大多不清楚AI将带给他们那些改变,也不知道他们为了AI的开展做出的贡献,他们仅仅互联网年代的新一代螺丝钉,而且随时或许被替代。

(补白:文中人物皆为化名。)

发布者:admin,转转请注明出处:https://www.bbhongyi.com/8511.html

(0)
上一篇 2023年 10月 7日 下午4:12
下一篇 2023年 10月 9日 下午3:37

相关推荐

  • 史上“最拥挤”五一档! 16部电影将扎堆上映,你最期待哪一部

    假如假期不想去外地,走进电影院或许是个不错的选择。本年五一假期可能是真实意义上的史上“最挤”五一档,到现在,已宣布将在五一期间上映的影片多达16部。 4月17日,记者在六堰亚新世界影城了解到,该影院现已敞开了五一档部分电影票的预售。该影院值勤店长兰何天鹏说,五一期间会集上映的16部电影题材包括爱情、喜剧、故事、军事等,其间《人生路不熟》和《惊天救援》影片已有…

    2023年 4月 17日
    1.0K0
  • 网上流传浪姐一公淘汰名单,凯丽、王佳宇、唐伯虎、陈冰、谢欣则

    近来,网上传出《乘风2023》第一次和第2次公演的筛选名单,其中一公筛选陈冰、王佳宇、唐伯虎、许靖韵、凯丽。 二公则筛选汪小敏、赵丽娜、李彩桦、吴倩,对于这份名单,不少网友表示不理解,引起网友热议。 网上让说徐怀钰、谢娜、美依礼芽筛选度还挺高,徐怀钰划水严峻筛选接下来有或许,但谢娜、美依礼芽筛选绝对不会筛选,还一定能到决赛。 人气最高的两位,一公的时分两位粉…

    2023年 5月 14日
    1.2K0
  • 致敬《流浪地球2》国内首款同级ChatGPT机型MOSS正式开源

    快科技4月21日讯,ChatGPT最近几个月火起来之后,国内的AI大模型也如雨后春笋般涌现,其间复旦大学开发的大模型MOSS被认为是国内首个类ChatGPT模型,姓名也是问候《漂泊地球2》中的量子机器人MOSS,现已正式开源。 复旦大学自然言语处理实验室之前承诺在3月底开源,不过此前在测试时曾发布在揭露渠道,导致瞬间压力过大,服务器都过载了,当时学术团队还表…

    2023年 4月 21日
    1.1K0
  • 中秋国庆假期最拥挤城市排行榜:北京、上海、广州、深圳均未上榜,河南南阳排名第六

    9月29日是中秋国庆长假的榜首天,百度地图发布交通出行大数据,全国最堵的城市、高速路段、机场、火车站同时出炉。城市方面,广东肇庆高居榜首,拥堵指数达3.686,这意味着同样的路程,要花3.686倍于往常的时间才能走完。第二名的清远同样来自广东,拥堵指数3.039,也是唯二超过3的城市。陕西西安拥堵指数挨近2.6,成为北方当时“堵城”的代表,吉林长春也到达了2…

    2023年 10月 7日
    9580
  • 近九成受访青年看好汉语热在全球持续升温

    汉语影响力在哪儿会添加?受访青年首选东亚,其次是欧洲 中青报·中青网记者 孙山 王品芝 实习生 孙丽萍 侯中杨   外国人汉语说得越来越溜、许多文艺作品出圈海外、我国古典文明遭到更多外国人的重视……这几年,汉语的影响力正在不断扩展。我国青年报社社会查询中心近来联合问卷网(wenjuan.com),对2002名青年进行的一项查询显示,86.7%的受访青年看好汉…

    2023年 4月 20日
    9870
  • 天津大爷跳水是如何成为“8A级”景点的?

    近来,天津的跳水大爷们忽然引发了大量的关注。在交际媒体上,多段天津大爷大妈们在海河跳水的视频广为流传,并使得海河上的狮子林桥、北安桥等地成为网红打卡“景点”。 我国新闻周刊了解到,天津大爷们的跳水方法颇具特征,跳水前会有开场白,并与现场观众互动,诙谐幽默,伴随着一声声的惊叹声或赞扬声,他们或前空翻或后空翻跳入水中,姿态各异。 有评论戏称,天津大爷们的跳水现已…

    2023年 8月 30日
    1.0K0
  • 抖音“元老”、西瓜视频前总裁辞职?字节跳动“VR之战已经失败”!

    抖音“元老”、西瓜视频原总裁离任?字节跳动“VR这场仗败了”! “字节跳动一向奉行谁开疆拓土谁就往上升,谁失利了谁就走的准则。” 记者丨杨月涵 一年前,没顶住铺天盖地的广告攻势,消费者王先生果断下手了一台PICO 4。 在他的形象里,其时PICO 4的宣扬满大街都是,下班回家的必经之路上,建筑物外立面巨大的液晶广告牌里,主角PICO4让他心动不已。那或许也是…

    2023年 10月 26日
    9410
  • 从月销5万到1.8万,国民神车为何卖不出去?

    5月22日,五菱宣布五菱宏光MINIEV家族降价1.3万元,全系2.98万元起,为消费者提供超低门槛的新能源产品和服务。 3万元就能拥有一只电动小可爱。凭借极致的性价比和可爱的外观,五菱宏光MINIEV曾创下单月销量破5万辆的记录,并连续28个月成为新能源汽车领域的畅销车型。 宏光MINI EV销量火爆,甚至引发了改装热潮。被誉为一代“国民神车”。不少车企眼…

    2023年 5月 22日
    1.1K0
  • Sora进军抖音,短视频营销革命即将来临了吗?

    文 | 增加工场,作者 | 相青,编辑 | 徐伟 “咱们都知道它会来,但没想到这么快。” 自上一年AIGC爆火,很多人就开端等待文生视频模型,也的确有一些文生视频模型和公司跑出来,比方国外AI创业公司Runway、Pika等,以及国内,字节跳动年头曾发布一款超高清文生视频模型MagicVideo-V2,百度文心一言也曾展示依据文和图片生成视频的能力。 但直到…

    2024年 3月 1日
    9450
  • 男女三亚相亲遇疫情同居13天 两人已在12月26日登记结婚

    本年8月,本年35岁的聂女士和李先生在三亚相亲由于疫情被逼同居13天一度引发关注。12月28日,北京青年报记者从当事人聂女士处获悉,4个月后,聂女士和李先生两人已在12月26日登记成婚。聂女士晒出成婚证,网友们也纷繁送上了祝愿。 聂女士说,领证当天,他俩现已感染过新冠,之前发过烧,没洗头没洗澡就去了,“感觉好搞笑,但好高兴。”她坦言,正是同居那段时刻的真实共…

    2022年 12月 29日
    1.1K0