丹参

首页 » 常识 » 诊断 » 给人工智能当老师拉框拍摄识万物
TUhjnbcbe - 2022/9/6 8:43:00
北京好看雀斑医院 http://baidianfeng.39.net/a_wh/210304/8714503.html

昔日流水线上的工人,成为了教“人工智能”认识苹果、桌子、椅子的第一位老师

8月7日下午,刘研娜正在给不同种类的汽车拉框。

河南郏县千机数据的办公室,如同一个大网吧。

人像采集现场。记者周小琪

芒种刚过,河南郏县东郊,望不到边的农田里,农民们弯腰割起了小麦。不远处机械厂、汽车修理厂,机器声此起彼伏。但再往西的建材广场却人来人往,这些天,广场三楼,来了个长了眼袋的人。

这个人中,有刚从玉米地里匆匆赶过来的农民,连草帽也没来得及摘下。有机关大楼下了班的公务员,也有服装店里请了假的导购员。年轻小姑娘们聚在一起,谈论着护肤和美妆。角落里,大腹便便的中年大叔点了根烟,低头玩起手机。

他们被轮流带进了临时搭的摄影棚里——一个光线昏暗、不到30平米的小房间,墙壁不久前刚被刷得雪白,里面摆着椅子、三脚架和灯光器材。

有人指引他们坐在椅子上,面朝一部被固定在黑色三脚架上的手机,手机和眼袋者之间的距离是25厘米,不能多,也不能少。每次开拍前,一名皮肤黝黑,身材微胖,长着老实憨厚方脸的员工都会掏出卷尺,仔细再量一遍。

方脸员工叫张凯。量完距离后,他需要用5部像素不同的手机拍摄这些有眼袋的人。

在白光、*光、暗光等不同光线下,张凯拍了四轮,加起来总共张。一般情况下,他3分钟就能拍完,不会超过5分钟。

这项工作名为“数据采集”,眼袋者能得到一个价值一二十元的塑料大桶作为奖品。采集而来的照片、语音等数据,将会提供给人工智能企业,用于机器的训练和学习。

刚接下任务时,领导告诉张凯,这次被拍下的双眼袋,会用来给一款手机软件做测试,以便优化软件的美颜功能。但具体怎么测试、怎么优化,领导没说,张凯也没问。

拉对一个框能赚4分钱

去年夏天,张凯有了孩子,他辞掉了原本在石子厂维护器械的工作,回家照顾妻儿。一两个月后,张凯得重新工作养家,一家名为“千机数据”的公司正好在招人,“轻松、离家近、工资高”。

公司在县城东边一个建材广场的三层,从张凯的老家长桥镇开车过来,只用20分钟。他推开公司门的那一刻,空调的凉风灌进身体,面前的场景让他有些震惊:几百名员工坐在棕色的沙发上,埋在电脑屏幕前,不停地拖动鼠标,敲击键盘,“像个大网吧”。

人力主管向他介绍说,公司主要做数据标注,简单来说就是给图片上的物体拉框框,只要会用电脑就能干。工资保底块,多劳多得。

张凯从没听说过“数据标注”,也不懂为什么拉框。但公司环境好,不像以前一样风吹日晒,当即决定留下来。

他被安排在一个有电脑的工位上。领导传来几百张厨房、餐厅的图片。张凯需要做的是:把图片上的碗、碟、杯子、筷子等餐具都框出来,然后选好属性、分好类。拉对一个框能赚4分钱。

张凯觉得很新奇——把这些锅碗瓢盆框出来能干吗?但初来乍到,他没好意思多打听。

第一天上班,张凯费劲拉了几百个框。他不熟悉规则,比如,三个堆在一起的碗,是应该一起拉一个框,还是分开拉三个框?

一周后,他已经熟练到每天能拉几千个框,挣多块钱。时间久了,张凯看什么都带框,看到家里厨房的锅碗瓢盆,他第一反应是,框框应该从哪个角度拉?拉多大比较合适?

才来三个月,张凯就开始挑战难度更高的3D全景图。图片都是立体的,有多个平面,分布着各种车辆,有卡车、小汽车、大巴车等,张凯要把车辆都框出来,再分门别类。

这项工作要有良好的空间感才能完成。玩“穿越火线”(一款射击类游戏)的经验帮上了张凯,那款游戏的场景也是立体的,常常需要切换视角来观察敌人。张凯没费多少力气就上手了。

工作了大半年,张凯就已经是公司最优秀的员工之一,但他依旧没问过,拉这些框是为了什么?“我的原则是,我赚我的钱就行,其他的不用管那么多”。

拍摄有眼袋的人

“数据标注”的工作干了一年,张凯开始接手新任务“数据采集”。

采集而来的数据,将会被打包上传给人工智能企业,企业再把这些数据分配其他公司进行“数据标注”,最后再传回去,成为计算机的学习资料。这些资料能教计算机分辨车辆、厨具等不同的物体,让它们像人一样,去认识大千世界。

张凯的第一项采集任务就是拍摄有眼袋的人。公司给出的要求,卧蚕和黑眼圈都不行,年龄必须在18岁到40岁之间。

找人从公司内部开始。多名员工,只要领导在公司里吆喝一声,满足条件的就自觉过去排队。

员工拍完以后,再发动他们拉着自己有眼袋的亲朋好友来拍摄。除此之外,公司还联系了各个村子有威望、人缘好的人,给他们中介费,让他们来帮忙找。

一开始,张凯完全分不清眼袋、卧蚕和黑眼圈。在他看来,它们都是堆在下眼睑的皮肤组织,只有喜欢熬夜或者上了年纪的人才会有。

为了这次拍摄任务,张凯仔细研究了很多张照片,终于搞明白这三者的区别:眼袋呈倒三角形,浮肿而松弛;卧蚕是椭圆形的,比眼袋小很多,笑的时候才明显;黑眼圈则是乌黑色的、平坦的,不会像眼袋和卧蚕一样凸出来。

但有眼袋的人太少,一天最多只能拍十几个。公司决定把条件放宽,有卧蚕的人也可以参与拍摄,这样一来,一天能拍到多人。

拍摄前,张凯少不了回答被拍摄者的质疑。有人问,“照片上有我们的正脸,你们会不会拿来做违法的事?要是把它们用来刷脸支付怎么办?”

张凯给出解释:“大街上那么多摄像头,如果拍几张照片就能用来刷脸支付的话,走在路上是不是也不安全?”

“我们公司是正规的,在郏县开了两年了,几百号人,跟我们合作的都是大企业,你就放心吧。”

参与过拍摄的人将会成为公司的人脉。去年夏天,公司接了一个大项目,一次性采集了两万多人的影像。

张凯的同事苏乐丹参与了这个“两万多人的大项目”。项目在一间废弃的二层工厂进行,以三十人或五十人为一组,排好队,依次戴上墨镜、口罩或帽子,在一楼、二楼或室外转几圈,转完圈就可以获赠一口印有“千机数据”的铁锅。

摄像头固定在厂房的不同角落,苏乐丹的任务是,拿一个大喇叭,维持转圈圈的秩序,让他们控制恰当的间距。

这个项目小孩老人都能参加,苏乐丹叫婆婆也来,婆婆不明白为什么要转圈。苏乐丹解释,是用于摄像头的对焦测试,检测在不同场景、不同装扮下,摄像头能否识别出同一个人。

但婆婆不能理解。苏乐丹拉着婆婆到村口,指着监控说,“就是测试这个能不能精确地拍到犯罪分子”,婆婆乐意了。

让AI认识苹果

创办千机数据之前,公司的CEO刘洋锋也很少听说“人工智能”这个词,他是公司学历最高的人之一,今年32岁。在他小时候,电脑还是个稀罕物,他看郑少秋演的《大时代》,没被纵横捭阖的证券市场吸引,只觉得每天坐在电脑面前敲键盘很酷。上中专时,他开始学计算机,次次专业课考试都是第一名。

但进入社会后,刘洋锋的工作几乎都碰不着计算机的边。他在重庆、云南和广东都待过,开过挖掘机、卖过饮料和化肥。他去过最远的地方是南美洲,在智利卖产自深圳华强北的山寨手机。

但他说,干计算机的梦想从没有被磨灭。有时,晚上做梦也会梦见计算机。

从智利回国后,刘洋锋和两个发小凑到一起,准备创业。去年,一个偶然的机会,他们在网上看到一个转让的“数据标注”的单子,这是刘洋锋第一次听说“数据标注”这个词。

刘洋锋先是试用了一下软件,在照片上框出了一个在马路上的行人,操作很容易。可他不明白“数据标注”是干什么的,网上搜不出多少信息,大部分他都理解不了,直到在一个网页看到这段话:

“要理解数据标注,得先理解AI其实是部分替代人的认知功能。我们学习认识苹果,需要有人拿着一个苹果告诉你,这是一个苹果。类比机器学习,我们要教他认识一个苹果,给它一张苹果的图片,它是完全不知道的。我们得先有苹果的图片,上面标注着‘苹果’两个字,然后机器通过学习了大量图片的特征来认识苹果。”

刘洋锋懂了。他把“苹果”的例子讲给发小听,他们都觉得“这事儿能成”。

从上世纪50年代,美国科学家第一次提出了“人工智能”的概念后,经过60年的技术更迭,人工智能已逐渐渗透进人类的生活。

手机听懂了人类的语言,车辆学会了选择最优路线,能绕过桌子腿、捕捉每一粒灰尘的扫地机器人走进了千家万户。而广为人知的人脸识别技术,不仅帮警方在张学友演唱会上先后抓到了多名逃犯,也在今年6月,帮四名走失10年的孩子找到了家。

刘洋锋并不了解人工智能相关的技术,但从新闻上感觉到人工智能会是未来科技发展的新趋势。

他们仨一起凑了10万块钱,在县城租下了一间30平

(上接)方米的单间,从郑州拉回了20台价值0多块的二手电脑。然后通过

1
查看完整版本: 给人工智能当老师拉框拍摄识万物