一旦贴上标签,汽车就能在几秒钟内识别交通信
时间:2025-11-05 11:46 作者:365bet体育

“数据标注”业务项目经理黄雨辰作品。编者按:当流水线工人换上AI培训师,当工厂的轰鸣变成数据的流动,湖北以产业链的蓬勃发展,为“人去哪儿”提供了有力的答案:工作在产业的每一次变革和布局的新赛道、新形势下扎根。即日起,本报将开设“行业中就业成长”栏目,敬请关注。文/图 湖北日报全媒体记者刘天宗看街景。人们一眼就能看到“车、人、红绿灯、建筑物、道路”; Ai看到的只是一堆0-255像素的矩阵。对于人工智能来说,标记数据意味着“翻译世界”。应《纽约时报》的要求,数据注释器出现了。在武汉理工大学科技园,蓝一(武汉)智能数据服务有限公司拥有一支500余人的数据标注人员团队,分布于国内外多个城市。省外,平均年龄不到30岁。 27岁的恩施女孩黄雨辰就是其中之一。 2020年加入蓝一智能,如今已经从一名普通的“数据标注员”成长为“项目经理”。令人惊讶的是,他的主修大学是汉语言文学。在数据、代码、算法无处不在的AI赛道上,文科生确实被挤到了关键位置。对于新手来说上手并不是太难。他留着及肩的短发,戴着黑框眼镜,一件休闲T恤,一台平板电脑和一些书……当我第一次在蓝一智能门外看到黄雨辰时,我以为她是一个去图书馆自习的女大学生。当你打开办公室电脑时,映入眼帘的是一幅令人瞠目结舌的图像——连接的点图、彩色注释框、互连的标记线等,形成了一系列“网络”风格的城市街景。 “这是数据注释n——对文本、图像、视频、语音等不同类型的数据进行‘标注’、‘书写描述’、‘添加注释’,方便大型AI模型中的学习和理解。”黄雨辰解释道。AI产业的三要素是数据、算力和算法。其中,数据是AI的“营养源”,算力是“肌肉力”,算法是“思维方式”。数据标注就是创造比如一张城市街景,需要人们用专业软件标注汽车、行人、道路、红绿灯、建筑物、绿化带、线路等各种元素,训练大AI模型的“视力”和“脑力”,“只要你有很强的学习能力、耐心和谨慎,熟练操作电脑,就可以了。”不太黄雨辰透露,2020年,也就是他大学毕业的那一年,湖北的数据标注行业刚刚开始兴起,实习生巨大短缺。通过nThinking尝试,他向蓝一智能投递了简历。初学者的套路都是入门级的,比如车载摄像头拍摄的标签图像。对于黄雨辰来说,类似于使用专业软件“P照”,这是女孩子喜欢和擅长的。每张图像中的行人、车辆、道路等元素加起来大约有60个“标注框”,成为新员工中的佼佼者,对“美食”数据的要求越来越高。如果每天要编辑几十甚至上百张照片,你难免会感到无聊。 “相比于r“影楼制作的图像精细,数据标注图像的准确性更高。”黄宇辰说,入职第一年,他主要处理二维图像数据,即车载摄像头拍摄的图片。每张图像标注后,公司都有专门的质检人员检查标注的质量,误差不能超过1个像素。例如,在24英寸的显示屏上,分辨率调整为1920(宽)×后1080(高度),每个像素的长度和宽度都小于0.3毫米,相当于将一张图片精确地“切割”成一个像素的“万花筒”,黄宇辰表示,数据标注者的日常工作是“零碎”地分析,而工作效率高的人可以得到更多。标注速度慢、质量低的人只要花更多的时间和精力就可以弥补自己的不足。此外,车企下的订单大多涉及新车型开发和生产调度,这就需要数据标注员每天按照节点毫不拖延地完成工作任务,所以迟到、加班是很正常的。由于出色的表现,黄雨辰从数据标注员、团队负责人、项目主管成长为项目经理,协调培训、对接客户、生产调度、交付多个蓝亿智能项目。他负责的项目类型也涵盖汽车领域、工业制造、智能安防、新零售、医疗、金融等行业。 “大型AI模型大约每三四个月就会迭代一次。市场对数据标注的需求越来越大,标注的内容也越来越复杂。”黄雨辰说道。以自动驾驶为例。在最初的几个黄宇辰刚开始工作时,主要对车载摄像头拍摄的二维图像数据进行标注,并框定图像中的车辆、行人、交通标志等物体。由于二维图像数据无法检测距离和空间,激光雷达和毫米波雷达生成的三维点云数据的标注得到迅速发展。然而,自动驾驶汽车行驶时,周围环境是动态的,三维点云数据仅提供静态的空间场景。因此,包含时间序列信息的四维标注将在2024年开始出现,它将更全面地描述物体的运动轨迹、形态变化以及物体与环境的相互作用。目前,从蔚来、理想、吉利、东风、长安等车企向蓝一智能发来的订单来看,四维点云数据标注已成为主流特雷姆。 “这说明中国自动驾驶技术正在快速发展,人工智能对数据‘粮食’的要求越来越高。”黄雨辰说道。帮助AI摆脱“心理内耗” 黄雨辰以“人工智能+智能”解构人工智能产业。日益智能的AI模型背后,是大量数据标注者夜以继日的默默奉献。蓝亿智能创始人兼总经理张雪娇是一位“90后”。他看到了黄雨辰等人数据标注者日益增长的困难。近年来,我国每年新增数百家数据标注公司。 “一个企业想要在集约化的行业中生存,就必须拥有自己的‘技术护城河’。”张雪娇介绍,凭借武汉理工大学在汽车行业的背景优势,蓝亿智能正在解决数据标签问题。平台满足大多数车企需求,自主研发了“行”数据标注与管理平台,可实现“采集-清理清理-脱敏”的一站式数据处理,提高数据标注的效率。多团队协同标注,完善智能检验检测的提供者。企业相信。