5 到 10 年后,当人工智能全面普及时,技术先驱和新一代商业巨头注定会被时代的聚光灯所铭记。
但今天,《甲子光年》想讲述一个关于人工智能“从未被告知”的故事,写下一群时代大幕背后的“隐形人”——标记数据的人。
在智能时代滚滚巨轮下,一批批用于“人脸识别”、“自动驾驶”、“自然语言处理”的标注数据来源于这些学历低下,每天在电脑上工作8到8天日。在10小时人的手中——他们是“人工智能背后的人工”。
《甲子光年》采访了多家数据标注服务商、数据标注工作室和数据标注师。据业内人士估计,中国全职“数据标注员”已达10万人,兼职人数接近100万。
其中有职业高中生、尝试过40个工作的聋哑人、从工地转来的新生代农民工……他们在不断提供最重要的“数据燃料”对于人工智能的发展。 ——在现有技术框架下,数据量越大,质量越好,算法模型的性能就越好。可以说,数据决定了整个人工智能产业的发展趋势。
但是贴标工作本身就是一种劳动密集型的工作,收入不高。随着技术的进一步发展,未来可能会被取代。许多数据标注者的父母都是参与中国房地产奇迹的农民工。如今,父母手中的铁锹已经成为年轻人的鼠标和键盘,但和父母一样,他们仍然被边缘化。在这个跨年夜,他们也和父母一样踏上了回家的旅程,不仅从城市回到农村,更从科技前线回到老火堆。
小智从贵阳坐了四个小时的公交车到他在山区的家。他做的第一件事就是把钱交到妈妈手里;
本本给父亲买了一台新的电动剃须刀;
何军家在河南周口,打算攒钱娶妻。过年期间,他会遇到几个相亲;
小原想多赚点钱,然后换个助听器。现在他戴这个很多年了,对他不断长大的耳蜗造成了新旧伤害……
我们无法预测他们的命运,但选择讲述他们的故事。这些技术进步背后的“未知”值得认真审视。
数据折叠
在人工智能的世界里,有一种不为人知的“数据折叠”:
一方面,有炫酷的技术和神奇的智能应用;另一方面,每天有大量的人在重复生产机器学习“食物”标记的数据。
北京和贵阳是数据标注世界的两个“双子座”城市。北京聚集了一大批;近年来,贵阳着力发展“大数据战略”,拥有较为完善的数据服务产业生态。
2017年,仅北京中关村的大数据产业规模就超过700亿元; 2017年,贵阳大数据产业及相关产业总规模超过1500亿元。 AI产业的总规模也在不断增加。根据麦肯锡 2017 年 4 月发布的报告,到 2025 年人工智能应用的总市场可能达到 1270 亿美元。
但标注数据的人生活在这些庞大的数字之外,工资很低,他们的活动在“第二空间”。
从三里屯驱车1小时30公里,到达北京邮电大学宏福校区。有北京邮政和华腾硕博联合举办的电子商务培训班。学生总人数300余人,高峰期参与数据标注兼职项目120余人。
贴标工作室占据教学楼二楼的 5 个房间。一群十八、十九岁的学生坐在150台电脑前,盯着电脑屏幕构图。他们以流线型的方式操作鼠标——这些枯燥的任务最终会用在活泼酷炫的无人驾驶项目中。
从标注数据的教室的窗户向外望去,可以看到北京邮电大学,那里有专门为国际学院和计算机专业学生提供的机房。
兼职标准数据培训班学员月收入约2000元。全职做的话,人均工资在4000到5000元左右。至于未来坐在教学部的算法工程师,刚毕业的时候起薪可能会达到30万元/年。
BasicFinder 下的数据工厂
学员参与的标注项目采用了当前数据标注行业的主流模式之一——“外包”。
一位数据标注主管告诉《甲子光年》,AI数据标注外包市场始于2011年,真正开始是2015年,2016年下半年收缩,2017年又爆发了。
外包盛行是因为人工智能的发展需要大量人力来处理用于机器学习的非结构化数据。创业团队和巨头公司为了专心研发或保持团队的高学历,很少组建自己的数据标注团队。
日前,海外媒体曝光了一组全新奥迪A6 allroad冬季路试的谍照。新车采用全新一代奥迪A6的设计元素,预计将配备quattro全时四驱系统和高度可调的空气悬挂系统。预计将于9月在法兰
有人说是人工智能的春天,有人说是夏天,也有人稍微悲观一点,说是秋天。秋天意味着冬天即将来临。作为人工智能的学者,我们应该如何看待这件事,又能做些什么呢?不管大家怎么预测,至少
动力:3.0T不急,加速时依然保持绅士风度A6allroadquattro搭载的3.0TFSI机械增压发动机,搭载燃油直喷技术和S可变气门升程系统,最大功率245kW(333PS)/5500-6500rpm,最大扭矩440Nm/290
来源 |人民日报“今天,我们进入了转型的新阶段。引领物流业爆炸式裂变的不仅是模式和资本,还有人工智能、云计算等新兴技术。”顺丰集团首席技术官兼顺丰科技CEO田敏表示。在
计算机人工智能技术应运而生,应用范围有多广?摘要:随着社会经济的快速发展和科技水平的不断提高,计算机人工智能技术应运而生。这种现代技术可以起到促进自动规划和智能控制的作
中国的人工智能发展迅速,中国政府也高度重视人工智能的发展。预计到2020年,中国人工智能产业规模将超过1500亿元,带动相关产业规模超过1万亿元。2017年,中国占全球新兴人工智能