翻译 | SHAWN
编辑 | Donna
斯坦福大学的研究人员开发出了一种可以进行观察和学习的算法,他们用这种算法分析了百万张公开的Google街景(Google Street View)图像。经过这种训练后,算法可以识别给定社区的车辆,判断社区居民的政治倾向。
从低调奢华的宾利到可靠的家庭休旅车,再到实用的皮卡,美国人深知汽车能反映车主的性格。正如那句西方谚语所说:You are what you drive(人如其车)。斯坦福大学的研究人员将这句谚语的含义延伸到了新的层面——开什么车代表你投哪个党的票。
研究人员用可以进行观察和学习的计算机算法分析了数百万张公开的Google街景图像。他们发现,算法可以利用学到的知识研究给定社区的车辆,以此判断该社区居民的政治倾向。
李飞飞,斯坦福大学计算机科学副教授、斯坦福大学人工智能实验室及视觉实验室主任
这项研究由李飞飞所在的视觉实验室主导。李飞飞表示:
借助唾手可得的视觉数据,我们可以充分地了解我们的社区。相比之下,花费数十亿美元进行普查反而只能获得一点信息。更重要的是,这项研究让人们更加相信我们可以利用廉价易得的视觉数据进行社会研究。
“算法经过训练”,更准确地说,是算法经过自我训练后,可以识别5千万张Google街景图像(拍摄于200个美国城市)中每辆1990年后生产的汽车的车型、型号和出厂年份。
然后,将车型和位置数据分别与当前最全面的人口统计数据库American Community Survey(美国社区调查数据库)及总统选举投票数据作对比,以此估计种族、受教育水平、收入和选民偏好等人口要素。
李飞飞和她的团队发现:汽车、人口统计数据和政治倾向之间存在着某种简单的线性关系。他们11月28日在《美国国家科学院院刊》上发表的论文是这样描述的,这三者之间的社会关系“虽然简单但很重要”。
举例来说,如果某一社区中轿车比皮卡多,该社区的居民有88%的概率会投票给民主党;如果皮卡比轿车多,居民则有82%的概率会投票给共和党。
及时和连续的数据更新
抛开明显的政治影响不说,研究人员认为他们的算法还可以为当前的人口调查数据提供更加及时、更加连续的补充数据。目前,美国社区调查采用的方法是挨门逐户地进行民意调查,这种调查方法昂贵且耗费人力。美国政府每年在这项调查上的花费超过2.5亿美元。并且,即使已经花费如此巨额,数据收集和数据公布之间的时间间隔仍长达两年之久甚至更长,尤其是在小城市和乡村地区。
相比之下,李飞飞等人开发的算法利用免费公开、定期更新的Google街景图像数据库,几乎可以实时生成分析数据。
该论文的第一作者、前斯坦福大学视觉实验室成员Timnit Gebru称:“我并不认为这样的技术可以取代“美国社区调查”,但是可以作为该调查的补充和对数据进行更新。” Gebru现在在微软研究院的人工智能公平、责任、透明性和伦理(Fairness Accountability Transparency and Ethics in AI,FATE))小组担任博士后研究员。
Gebru表示做到这一步并不容易。首先,团队必须为所有1990年后生产的汽车手工构建一个图像数据库,标记每辆汽车的出厂年份、车型、型号、车饰信息,然后训练计算机识别图像中不同汽车之间的细微差别,这些图像的成像质量和拍摄角度并不理想。
细微差别
开始时,研究人员用汽车销售网站Edmunds.com 上的15000种车型构建了一个数据库,但是这只是开始。接下来,人类专家必须根据细微差别对这些车型进行逐一分类。举例来说,2007版和2008版本田雅阁(Honda Accord)只有尾灯稍微不同,两者之间的差别几乎无法察觉。
但是,算法的工作效率非常高,只花了两周的时间就根据车型、型号和出厂年份将5千万张图像分为2657个类别。相比之下,即使是工作效率较高的人类专家,每分钟也只能分类6张图像,完成同一任务需要花费多达15年的时间。
论文发出后,一些业内人士提出质疑。他们认为,由于这些图像的拍摄时间不一致,可能会影响算法对交通模式和汽车外观的识别。对此,Gebru表示,为了避免交通,许多Google街景图像实际上都是在早上拍摄的,因此图像在拍摄时间上存在一定的一致性。无论拍摄时车流量如何,这些图像都能够提供非常宝贵的数据。
旧金山某一居民区的Google街景图
Gebru说:“如果你在一个居民区观察过往车辆,有时车流密度所能提供的信息和车型提供的信息一样宝贵。所有这些信息都可以为算法所用”。
对这项研究的新应用,Gebru持有很高的期望。除了用于人口统计,视觉图像分析技术还可以用于改进对偏远地区的调查以及用于其他用途,例如:监测二氧化碳水平和缓和交通拥挤。
李飞飞也表示赞同:“计算机视觉技术可以帮助我们理解社会的运作方式,人们的需求以及如何改善人们的生活。这项技术有很大的潜力,它可以为我们带来很多好处。”
李飞飞还是斯坦福大学Bio-X研究中心和神经科学研究所的成员。这篇论文的作者还包括斯坦福大学研究生Jonathan Krause、Yilun Wang、 Duyun Chen以及密歇根大学和贝勒大学的同事。
作者 | ANDREW MYERS
原文地址:
https://news.stanford.edu/2017/11/28/neighborhoods-cars-indicate-political-leanings/?linkId=45266775
论文链接:
http://www.pnas.org/content/early/2017/11/27/1700035114.full.pdf
重磅 | 李飞飞最新演讲:ImageNet后,我专注于这五件事——视觉理解、场景图,段落整合、视频分割及CLEVR数据集
超越ImageNet?李飞飞力赞高徒的视频描述研究入选计算机视觉最前沿的十大论文
深度学习高手该怎样炼成?这位拿下阿里天池大赛冠军的中科院博士为你规划了一份专业成长路径
吴恩达团队最新成果:用深度学习来改善临终关怀服务
如何成为一名全栈语音识别工程师?
Twitter大牛写给你的机器学习进阶手册
AI研究生应届生年薪可达50万 没出校门已被"抢光
2017年首份中美数据科学对比报告,Python受欢迎度排名第一,美国数据工作者年薪中位数高达11万美金
关注公众号:拾黑(shiheibook)了解更多
[广告]赞助链接:
四季很好,只要有你,文娱排行榜:https://www.yaopaiming.com/
让资讯触达的更精准有趣:https://www.0xu.cn/