数据标注员的挑战:低薪、不稳定和AI替代威胁
10月9日消息,AI大模型近年来备受瞩目,为人工智能领域带来了令人惊叹的创新,如逼真的文本和图像生成,以及流畅的人机对话。然而,在这些先进技术背后,却隐藏着一支默默无闻的数据标注员队伍,他们日复一日辛勤工作,为AI技术提供所需的大量训练数据。 数据标注员的工作并不轻松,他们经常面对单调乏味的任务、低薪待遇、不稳定的工作前景以及被替代的风险。尽管他们是AI技术发展的基石,但却鲜少受到关注和尊重。 根据本站了解,数据标注员通常按件计酬,大多数从业者每月的收入不超过5000元。这些从业者来自不同背景,有专科毕业生、全职妈妈和职业转型者。他们在三四线城市的小格子间里处理各种数据,为互联网巨头和汽车制造商提供数据标注服务。
数据标注行业经历了起伏。2017年,AI技术兴起,数据标注员们能够赚取可观的收入,仅标注一个2D框就能获得5毛钱。然而,随着行业竞争加剧和技术发展遇到困难,数据标注的价格不断下降,现在最低仅为4分钱。 数据标注公司也面临巨大的挑战,它们需要拥有一定规模和足够的财力来获取订单,并且要应对回款周期长、员工流动性高、质量和周期不稳定等问题。海天瑞声是目前数据标注行业内首家上市公司,去年的利润率刚刚超过了10%,但今年上半年已经陷入亏损。 更让数据标注员们感到不安的是,他们可能会很快被他们自己参与培训的AI技术所替代。国内外有一些公司正在研发自动标注数据的工具,利用市场上流行的大型模型对数据集进行标注。这些工具声称可以提高标注效率、降低成本,并实现与人工标注相媲美甚至更高的准确性。 当然,并非所有的数据标注都可以被AI取代。一些需要专业知识和逻辑分析能力的数据标注仍然需要人工干预,例如医疗、金融和自动驾驶领域。但这也意味着数据标注行业的门槛将不断提高,对于数据标注员们来说,要在这个行业生存下去,可能需要更多的学习和努力。 |