| |前言
————
数据标注经过这几年的发展被越来越多的人知道,由于其入行门槛比较低,有很多刚毕业的学生加入到数据标注行业甚至在这一行“创业”,比如在某个地区,某个互联网大厂把该地区及周边的“大专生”做到“人尽皆知”的地步,这些存进了行业的发展,但是在粗鲁的发展中,也带来资源的“内卷”,在面对未来行业的变化中,有很多人或者团队会被淘汰。所以,如何顺应行业发展趋势以及如何在数据标注行业布局是行业内所有公司需要考虑的事情。
| |大厂的数据标注基地
————
从6月份回归到乙方工作后,对于数据标注的资源运营模式的思考一直没停过,尤其是经常听到“价格太低了“这句话,也有朋友准备干完今年后就离开数据标注行业。
- 本人一直认为 “大型基地”会是未来数据标注行业的载体 ,在未来,随着客户对数据的需求越来越个性化,质量要求越来越高,同时在“供需关系”的前提下,甲方将会倾向于将数据标注业务承包给有“实力”的数据标注公司,给到小团队的业务将会越来越少(如果还有人想开个小工作室,本人是真心不建议),举个例子,电商搜索业务,其主观性比较强导致其标注难度、准确率要求都比较高,一般要求有相关项目经验,如果是新人,则需要满足相关专业技能,而小团队在此项的人力储备完全不够,以至于无法承接。像这类公司承接最多的是自动驾驶、视觉类、ASR的项目。
- 目前,市场上出现的数据标注基地非常多。比如:
- 百度这两年扩增了近10个基地,人数怎么也得5000+人,这个规模承载的数据量是非常大的。
- 腾讯在有瑞得铭、云雀、岚柚等子公司外在重庆仙桃数据谷建立标注基地。
- 字节自营标注基地4个,认证BPO团队10+个。
- 小红书-武汉,快手-成都(审核基地,标注算在审核基地当中)
以上是互联网大厂的基地,除此之外还有很多地方政府和乙方建立的基地,大家在网上搜集信息应该能查到。
| |大厂基地的个人解析
- ————
- 在这里先给大家看看本人对于互联网大厂的基地的想法。
- 百度:国内数据标注行业的先驱,引领整个行业,从2018年8月在山西太原建立基地后先后在阳泉、山东、达州、酒泉、奉节、丽水等地建立基地,百度提供一些优惠政策,包括免除房租、水电、网络等等运营费用,实现“拎包入驻”,同时会提供项目吸引团队加入基地。但在和同行交流的时候,入驻的企业因为百度对基地的管理措施以及项目收入,其实印象一般,并没有那么热衷进驻。同时百度在北京和上海的外包项目经理团队的成本也挺大(工资都有2W+)。其次项目全部远程管理,对项目的交付的促进作用一般。整体算下来给我的感觉就是"由于公司的战略或地方政府给的补贴,百度需要把供应商吸引到这里,带动就业、带来税收等来完成政府要求的指标,从而拿到这些补贴。(场地都是政府的呦)"
- 字节:有钱的代名词,4个自营基地全正编,根据本人的测算,算上所有费用人均成本1.1万左右,在北京有项目经理团队,资源运营团队的大佬,规模加起来也有百人吧,一线员工顶上基地负责人的薪水,平摊下来把自营团队成本升升拉上去最少60%。在BPO团队上,认定了十几家近1000号人BPO团队,计时的,具体给一个人一个月多少钱不清楚,但是肯定比百度基地的5000+要多出不少。不过讲真,字节的运营能力比百度要强不少(平台工具不够,硬生生逼出来吧),基地的团队的项目质量把控很厉害,很能打,相较于其他团队有很明显的优势,但是在效率上差不少。
个人认为百度和字节两家的基地中,百度是将众包团队聚拢到一起,增强有限的管控能力,同时通过政府给的政策降低成本,也通过基地形式完善自己的数据标注生态。字节自营强在交付能力得到保障,但是付出的成本很高,同时对于众包给B端的业务的痛点仍然没有解决。
| |基地的未来构想
————
本人在甲方、乙方都有工作过,一直期望比较理想的标注人力资源运营的基地出现。这种基地主要解决两个点:提升项目交付能力&降低成本,同时也可以解决其他的小问题如保持人员稳定的输入、丰富数据标注业务生态、提升知名度等。本人认为理想型的一个甲方带动多个乙方共同打造数据标注基地,同时带动周边高职院校以及二/三本院校 。
回顾数据标注行业的发展,可以说目前行业属于红海的市场,很多信息都已经透明,包括价格,而因为行业的特性如入行门槛低,操作重复等特性,市场逐渐往成本低的地区或者机构转移,如三四线城市甚至更低成本地区,如学生的实习。随着这几年的大量的人员涌进数据标注行业以及很多“盲目”的人在这行创业,导致整个行业的资源非常内卷,日产值要求不断下降,月度收入5000块钱左右也有公司愿意做,甚至现在所谓的“5000元”的月度产值成为甲方众包给企业的“标准”,这在其他行业来看是一个非常“不可思议”的现象,也正是因为这种情况,校企合作是行业发展的一大特色,在此基础上会有在校和在企业两种形式。十九大明确提出“深化产教融合、校企合作”的要求,同时有《职业学校校企合作促进办法》作为指导,学校需要完成“横向课题”指标,而数据标注业务非常契合这一要求,未来在学生实习市场还有更大的发展(百度数据标注基地的员工大部分是大专实习生)。
根据过往经验来看,以学生实习成本来评估,入校生产和入驻企业生产有一定的区别:
- 校内实习:依托于学校“众创空间”,免除房租、水电等费用,企业需要支付员工工资、保险、团队运营管理成本。学生在校实习的平均月薪在1000-2000元左右,加上企业所有成本分摊预计在2500元左右,当然,校内实习生创造的收益比企业实习要低一些,但整理的净利率也要高不少。在劣势方面,首先是员工的管理体系不如在企业实习有力,项目交付不能更好的保障,其次是员工的心态以及课程问题。
- 企业实习:目前做数据标注业务的大型团队会选择和政府合作,得到一些优惠政策,比如共同建立基地,政府提供一些支持,但同时企业需要完成一定的指标,政府支持主要用于减少公司的运营成本。
根据本人在数据标注团队管理经验来讲,是非常抵触校内实习生产基地的形式,因为这种模式的管理太大以及项目交付的质量太低,会让团队管理和项目管理变得非常的被动,能够承接的项目也都是非常简单的,而简单项目在市场上越来越少,以致于这样性质的生产基地无法实现规模化,在行业人月净利较低的市场,所赚净利很难应对风险,如项目交接、人员空闲等带来的成本付出。当然,现在仍有一些团队的负责人在并不了解运营难度的情况下,从主观上觉得成本低而选择尝试,最后有点潦草收场。
本人认为,未来仍会朝基地化模式方向发展,远离学校,由甲方或者大型乙方来搭建基地,也奉劝现在自认为有背景的团队思考后再投入基地。