推荐 :6步教你用R语言制作动图

百家 作者:数据分析 2017-09-12 01:44:26

引言

 

数据可视化可能是数据科学领域最重要却通常最少被提及的部分。

 

我这么说是因为创造数据故事和可视化对你的顾客最终怎么看待你的工作有巨大的影响。数据科学不仅仅是说你的模型如何复杂或精细,它是使用基于数据的洞察力来解决问题(的范畴)。并且,为了实施这些解决方案,你的领导们需要了解你的计划


在创造有影响力的可视化进程中,挑战之一便是创造能够自己讲话的图像。这篇文章将会告知一种方式来帮你创作可使用的生动的GIF图像(即图表可交互化格式)。当你想要显示基于时间或者基于循环的故事时,这种方式将对你非常有帮助。在图片中采用动画的形式,你可以为特定组合的参数的画出随时间流动的可比的数据。换言之,理解并且看到某些参数随时间(的演进)而发生的改变。


请允许我用一个例子展示给你:

 

例子:GDP与预期寿命相比较

 

假如说你想去展示不同的洲/国家的GDP和预期寿命是怎样随时间的改变而改变的。你认为什么是最好的方式来展现这种关系呢?

你可以考虑多种选择,比如说:


  • 创造一个和GDP、预期寿命以及时间相关的3D制图,为每个洲或国家画出线条。问题是:人类阐释以2D形式画出3D图像的能力是非常的薄弱的,尤其是当存在太多数据时。因此,这个选择不奏效。


  • 一并创造2个图表:一个展示随时间而改变的GDP,另一个则显示随时间而变的预期寿命。这是一个二维制图。我们为读者留下了很多空间去诠释。读者需要选定一个国家并且看这个国家在每一个节点上的变化,然后把他们串联起来。最后再次循环。


现在,让我们看这个生动的动图文件吧。




Gganimate包的发展使得这问题更加容易实现。在这篇文章的最后,你可以制作属于自己的动图文件并且创造自己的定制框架以在全球或当地范围内比对不同的参数。

 

首要事宜


请先安装以下包:


  • ggmap

  • gganimate

  • dplyr

  • animation


此外,除了以上R库,你也需要自己的系统中有Image Magick软件。你可以下载并安装这个软件(https://www.imagemagick.org/download/binaries/ImageMagick-7.0.4-7-Q16-x64-static.exe)

 

获取数据


这篇文章试图用1965到2016年的地震数据来制作动图文件。最好是在地图上按年份顺序绘制全球地表活动而非静态呈现所有的数值。地震的数据集在Kaggle上是开放的(https://www.kaggle.com/usgs/earthquake-database)。数据集包括1965年至2016年地球地震活动的数据。请访问以上链接并且向下滚动以得到csv的文件夹。

 

从1965到2016年的发生过的里氏震级为7.0的大地震:这个数据集已经被改良过,只有里氏震级为7级的数据才被用于研究。

 

数据处理


为了简化流程,从csv文件夹里我们只挑选了很少几个变量:


  • 日期Date)

  • 时间(Time)

  • 经度(Latitude)

  • 纬度(Longitude)

  • 类型(Type,即地震活动的类型)

  • 宽度(Depth,即从地面闭合处到震源中心的距离)

  • ID(ID,即地震活动的事件标识)

  • 震级(Magnitude,即里氏震级的读数)


我们都准备开始用R语言译码,使用过R工作室的环境。你可以自由地使用你偏爱的任何环境。

 

R语言代码

 


把日期分割到年、月和天


我们要做这件事情是因为我们要得到对绘图非常重要的。换言之,这个方法的核心就是将框架(frame)当成另一维度,就像x,y轴,尺寸,颜色,等等。因此,你的数据中的一个变量可以被投射到框架中,这个过程就像其他变量被投射到X或者y。




使用animation包来加速gif图片中的投影

 

正如我们看到的那样:这个动图包含1965年到2016年多年的图片。因此,为了加速可视化的呈现,我们可以用Animation包中的ani.option()来加速。




结论


这篇文章是对动图世界的一个入门教程。读者可以在其他的项目里尝试和应用同样的方法。一些例子如下:


  • 相同的技术可以被用于比较不同国家的天气数据的热力地图。

  • 一段时期内某个特定地点洪水或其他自然灾害。

  • 可以利用德罗内三角板来见证城市地铁的增长。可以看Page Piccinini在r-Bloggers所发布的有趣的文章《随时间变化的地铁系统》(https://pagepiccinini.com/2016/09/27/metro-systems-over-time/)或者你可以直接从她的官网(https://pagepiccinini.com/2016/09/27/metro-systems-over-time/)访问她的页面。


希望你觉得这篇文章有用。


原文链接:

https://www.analyticsvidhya.com/blog/2017/06/a-study-on-global-seismic-activity-between-1965-and-2016/

原文标题:How to create animated GIF images for data visualization using gganimate (in R)?

作者:GUEST BLOG;译者:赵向智;

本文转自:数据派THU 公众号;

END


推荐:

优秀人才不缺工作机会,只缺适合自己的好机会。但是他们往往没有精力从海量机会中找到最适合的那个。100offer 会对平台上的人才和企业进行严格筛选,让「最好的人才」和「最好的公司」相遇。

扫描下方二维码或点击“ 阅读原文 ,注册 100offer,谈谈你对下一份工作的期待。一周内,收到 5-10 个满足你要求的好机会!

关联阅读

原创系列文章:

1:从0开始搭建自己的数据运营指标体系(概括篇)

2 :从0开始搭建自己的数据运营指标体系(定位篇)

3 :从0开始搭建自己的数据运营体系(业务理解篇)

4 :数据指标的构建流程与逻辑

5 :系列 :从数据指标到数据运营指标体系

6:   实战 :为自己的公号搭建一个数据运营指标体系

7:  从0开始搭建自己的数据运营指标体系(运营活动分析)

数据运营 关联文章阅读:  

运营入门,从0到1搭建数据分析知识体系    

推荐 :数据分析师与运营协作的9个好习惯

干货 :手把手教你搭建数据化用户运营体系

推荐 :最用心的运营数据指标解读

干货 : 如何构建数据运营指标体系

从零开始,构建数据化运营体系

干货 :解读产品、运营和数据三个基友关系

干货 :从0到1搭建数据运营体系

数据分析、数据产品 关联文章阅读:

干货 :数据分析团队的搭建和思考

关于用户画像那些事,看这一文章就够了

数据分析师必需具备的10种分析思维。

如何构建大数据层级体系,看这一文章就够了

干货 : 聚焦于用户行为分析的数据产品

如何构建大数据层级体系,看这一文章就够了

80%的运营注定了打杂?因为你没有搭建出一套有效的用户运营体系

从底层到应用,那些数据人的必备技能

读懂用户运营体系:用户分层和分群

做运营必须掌握的数据分析思维,你还敢说不会做数据分析

关注公众号:拾黑(shiheibook)了解更多

[广告]赞助链接:

四季很好,只要有你,文娱排行榜:https://www.yaopaiming.com/
让资讯触达的更精准有趣:https://www.0xu.cn/

公众号 关注网络尖刀微信公众号
随时掌握互联网精彩
赞助链接