1. 首页
  2. 人工智能
  3. 正文

【甲子光年】中国房地产“从未被讲出”的故事

 2021-09-10 06:01:06  来源:互联网 

5 到 10 年后,当人工智能全面普及时,技术先驱和新一代商业巨头注定会被时代的聚光灯所铭记。

但今天,《甲子光年》想讲述一个关于人工智能“从未被告知”的故事,写下一群时代大幕背后的“隐形人”——标记数据的人。

在智能时代滚滚巨轮下,一批批用于“人脸识别”、“自动驾驶”、“自然语言处理”的标注数据来源于这些学历低下,每天在电脑上工作8到8天日。在10小时人的手中——他们是“人工智能背后的人工”。

《甲子光年》采访了多家数据标注服务商、数据标注工作室和数据标注师。据业内人士估计,中国全职“数据标注员”已达10万人,兼职人数接近100万。

其中有职业高中生、尝试过40个工作的聋哑人、从工地转来的新生代农民工……他们在不断提供最重要的“数据燃料”对于人工智能的发展。 ——在现有技术框架下,数据量越大,质量越好,算法模型的性能就越好。可以说,数据决定了整个人工智能产业的发展趋势。

但是贴标工作本身就是一种劳动密集型的工作,收入不高。随着技术的进一步发展,未来可能会被取代。许多数据标注者的父母都是参与中国房地产奇迹的农民工。如今,父母手中的铁锹已经成为年轻人的鼠标和键盘,但和父母一样,他们仍然被边缘化。在这个跨年夜,他们也和父母一样踏上了回家的旅程,不仅从城市回到农村,更从科技前线回到老火堆。

小智从贵阳坐了四个小时的公交车到他在山区的家。他做的第一件事就是把钱交到妈妈手里;

本本给父亲买了一台新的电动剃须刀;

何军家在河南周口,打算攒钱娶妻。过年期间,他会遇到几个相亲;

小原想多赚点钱,然后换个助听器。现在他戴这个很多年了,对他不断长大的耳蜗造成了新旧伤害……

我们无法预测他们的命运,但选择讲述他们的故事。这些技术进步背后的“未知”值得认真审视。

数据折叠

在人工智能的世界里,有一种不为人知的“数据折叠”:

一方面,有炫酷的技术和神奇的智能应用;另一方面,每天有大量的人在重复生产机器学习“食物”标记的数据。

北京和贵阳是数据标注世界的两个“双子座”城市。北京聚集了一大批;近年来,贵阳着力发展“大数据战略”,拥有较为完善的数据服务产业生态。

2017年,仅北京中关村的大数据产业规模就超过700亿元; 2017年,贵阳大数据产业及相关产业总规模超过1500亿元。 AI产业的总规模也在不断增加。根据麦肯锡 2017 年 4 月发布的报告,到 2025 年人工智能应用的总市场可能达到 1270 亿美元。

但标注数据的人生活在这些庞大的数字之外,工资很低,他们的活动在“第二空间”。

从三里屯驱车1小时30公里,到达北京邮电大学宏福校区。有北京邮政和华腾硕博联合举办的电子商务培训班。学生总人数300余人,高峰期参与数据标注兼职项目120余人。

贴标工作室占据教学楼二楼的 5 个房间。一群十八、十九岁的学生坐在150台电脑前,盯着电脑屏幕构图。他们以流线型的方式操作鼠标——这些枯燥的任务最终会用在活泼酷炫的无人驾驶项目中。

从标注数据的教室的窗户向外望去,可以看到北京邮电大学,那里有专门为国际学院和计算机专业学生提供的机房。

兼职标准数据培训班学员月收入约2000元。全职做的话,人均工资在4000到5000元左右。至于未来坐在教学部的算法工程师,刚毕业的时候起薪可能会达到30万元/年。

BasicFinder 下的数据工厂

人工智能 人工神经网络_人工神经网络教程_bp人工神经网络模型

学员参与的标注项目采用了当前数据标注行业的主流模式之一——“外包”。

一位数据标注主管告诉《甲子光年》,AI数据标注外包市场始于2011年,真正开始是2015年,2016年下半年收缩,2017年又爆发了。

外包盛行是因为人工智能的发展需要大量人力来处理用于机器学习的非结构化数据。创业团队和巨头公司为了专心研发或保持团队的高学历,很少组建自己的数据标注团队。

相关文章

热门排行

编辑推荐

扫一扫关注最新创业资讯