chen7qi的个人博客分享 http://blog.sciencenet.cn/u/chen7qi

博文

诺奖文章里面的动图绘制教程来了!!

已有 1896 次阅读 2019-10-28 19:51 |个人分类:生物信息|系统分类:科研笔记

作者:严涛 浙江大学作物遗传育种在读研究生(生物信息学方向)伪码农,R语言爱好者,爱开源。生信宝典对代码进行了系统测试和解释。

严涛老师的绘图教程还有:

ggplot2学习笔记之图形排列

R包ggseqlogo |绘制序列分析图

ggplot2高效实用指南 (可视化脚本、工具、套路、配色)

简介

R-Ladies是一个世界性的促进R语言社区性别多样性的组织,本文分析了这个组织的粉丝成员分布信息。

这篇文章主要基于d4tagirl,稍微有所修改。原文链接:

https://d4tagirl.com/2017/05/how-to-plot-animated-maps-with-gganimate

小编是用3.5.1版本的R重现以下过程的,gganimate包不能通过Tools——Install Pakages来安装,而需要从github直接安装,下面的命令适用于我所遇到的问题。(gganimate有两个包,本文用到的是老的版本。2019年诺贝尔化学奖揭晓 |八一八,那些年的诺贝尔化学奖中用到的是新版本,用法不太一致,还请注意。)

devtools::install_github("dgrtwo/gganimate", ref = "v0.1.1”)

另外一个依赖的软件是imageMagick软件,这是一个需要单独下载并安装在PC或服务器端的图形编辑软件,下载地址:https://imagemagick.org/script/index.php,选择适合自己电脑系统的一个版本进行安装。推荐ImageMagick-6.9.10版本,最新版存在与此R包的兼容性问题。gganimate的新版本不依赖于该软件。

注意:安装路径不要有中文和空格。

数据加载

# 加载包,若缺失则安装。
library(pacman)
p_load(tidyverse, gganimate, maps, ggthemes)
rladies <- read_csv(url("https://raw.githubusercontent.com/d4tagirl/R-Ladies-growth-maps/master/rladies.csv"))%>%
 select(-1)
head(rladies)


## # A tibble: 6 x 7
##   screen_name     location     created_at followers age_days     lon   lat
##   <chr>           <chr>        <date>         <int>    <dbl>   <dbl> <dbl>
## 1 RLadiesSF       San Francis~ 2012-10-15       916     1673 -122     37.8
## 2 RLadiesNYC      New York     2016-09-01       309      256 - 74.0   40.7
## 3 RLadiesIstanbul <U+0130>stanbul, T~ 2016-09-06       436      251   29.0   41.0
## 4 RLadiesBCN      Barcelona, ~ 2016-10-11       377      216    2.17  41.4
## 5 RLadiesColumbus Columbus, OH 2016-10-04       179      223 - 83.0   40.0
## 6 RLadiesBoston   Boston, MA   2016-09-06       259      251 - 71.1   42.4

可视化

主要是根据地理位置信息映射到地图上

# borders是map包中的函数,作用是获取地图信息和绘制地图
# 其它部分都是ggplot2的操作了
ggplot()+
 borders("world", color="gray85", fill="grey80")+
 geom_point(data = rladies, aes(lon, lat, size=followers), color="purple", alpha=0.5)+
 scale_size_continuous(range = c(8, 24), breaks = c(250, 500, 750, 1000))+
 labs(size="Followers", title="                                             The development of R-Ladies’ Twitter accounts",x=NULL,y=NULL)+
 theme(text = element_text(family = "Times New Roman", color = "#EEEEEE"), #这部分主题修改,自己尝试,应该有更简单的办法
       plot.title = element_text(size=40,color = "#f9ba00"),
       plot.subtitle = element_text(size=14),
       axis.ticks = element_blank(),
       axis.text = element_blank(),
       panel.grid = element_blank(),
       panel.background = element_rect(fill="#333333"),
       plot.background = element_rect(fill = "#333333"),
       legend.position = c(0.18,0.36),
       legend.background = element_blank(),
       legend.key = element_blank(),
       legend.text = element_text(size = 28),
       legend.title = element_text(size=28, color = "#f9ba00"))+
 annotate(geom = "text",
          label="Made by Logos ytlogos.github.io\nOriginally from d4tagirl https://d4tagirl.com",
          x=70, y=-55, size=10, family="Helvetica Black", color="#f9ba00", hjust="left")


动画展示

为了利用gganimate进行动态展示,需要构建一个映射变量:时间 (后面中的frame)。同时为了使得可视化开始呈现的是空白,结尾能继续保留展示一段时间,又构建了两个空白图层,就是下面2个数据表。

这里用的日期做的时间轴,其它数值变量或因子变量也都可以,注意根据需要修改。如果不是日期变量,不需要as.Date函数转换。

# 注意起始时间一定要早于、晚于真实数据中的时间。
# 每个时间生成一张图片,若有重名,会出现图片丢失,拼合出错。
ghost_points_ini <- tibble(created_at=as.Date("2011-09-01"), followers=0, lon=0, lat=0)
ghost_points_fin <- tibble(created_at=seq(as.Date("2017-05-16"), as.Date("2017-05-30"),by="days"), followers=0, lon=0,lat=0)


添加frame映射, aes中的frame和cumulative不是ggplot2的标准美学参数,不被识别,会弹出warning,忽略就好。gganimate可以识别这两个,frame指定用哪一列做时间轴,每个时间轴会生成1张图片;cumulative表示累加,新的时间轴包含之前的数据。


注意下面3个geom_point用到的数据表不同。


map <- ggplot()+
 borders("world", color="gray85", fill="grey80")+
 # aes中的frame和cumulative不是ggplot2的标准美学参数,不被识别,会弹出warning,忽略就好
 # gganimate可以识别这两个,frame指定用哪一列做时间轴,每个时间轴会生成1张图片;
 #  cumulative表示累加,新的时间轴包含之前的数据
 geom_point(data = rladies, aes(lon, lat, size=followers, frame=created_at, cumulative=TRUE), color="purple", alpha=0.5)+
 scale_size_continuous(range = c(4, 16), breaks = c(250, 500, 750, 1000))+
 # aes中的frame和cumulative不是ggplot2的标准美学参数,不被识别,会弹出warning,忽略就好
 # gganimate可以识别这两个,frame指定用哪一列做时间轴,每个时间轴会生成1张图片;
 #  cumulative表示累加,新的时间轴包含之前的数据
 geom_point(data = ghost_points_ini, aes(lon, lat, size=followers, frame=created_at, cumulative=TRUE), alpha=0)+
 geom_point(data = ghost_points_fin, aes(lon, lat, size=followers, frame=created_at, cumulative=TRUE), alpha=0)+
 labs(size="Followers", title="The development of R-Ladies’ Twitter accounts",x=NULL,y=NULL)+
 theme(text = element_text(family = "Times New Roman", color = "#EEEEEE"),
       plot.title = element_text(size=28, color = "#f9ba00"),
       plot.subtitle = element_text(size=14),
       axis.ticks = element_blank(),
       axis.text = element_blank(),
       panel.grid = element_blank(),
       panel.background = element_rect(fill="#333333"),
       plot.background = element_rect(fill = "#333333"),
       legend.position = c(0.18,0.36),
       legend.background = element_blank(),
       legend.key = element_blank(),
       legend.text = element_text(size = 18),
       legend.title = element_text(size=24, color = "#f9ba00"))+
 annotate(geom = "text",
          label="Made by Logos ytlogos.github.io\nOriginally from d4tagirl https://d4tagirl.com",
          x=70, y=-55, size=6, family="Helvetica Black", color="#f9ba00", hjust="left")
animation::ani.options(interval=0.15, ani.width=1500, ani.height=800, units="in")
gganimate::gganimate(map, filename = "d4tagirlmap.gif")


SessionInfo

sessionInfo()


## R version 3.4.3 (2017-11-30)
## Platform: x86_64-w64-mingw32/x64 (64-bit)
## Running under: Windows 10 x64 (build 16299)
##
## Matrix products: default
##
## locale:
## [1] LC_COLLATE=Chinese (Simplified)_China.936
## [2] LC_CTYPE=Chinese (Simplified)_China.936  
## [3] LC_MONETARY=Chinese (Simplified)_China.936
## [4] LC_NUMERIC=C                              
## [5] LC_TIME=Chinese (Simplified)_China.936    
##
## attached base packages:
## [1] stats     graphics  grDevices utils     datasets  methods   base    
##
## other attached packages:
##  [1] ggthemes_3.4.0       maps_3.2.0           BiocInstaller_1.28.0
##  [4] forcats_0.2.0        stringr_1.2.0        dplyr_0.7.4        
##  [7] purrr_0.2.4          readr_1.1.1          tidyr_0.8.0        
## [10] tibble_1.4.2         ggplot2_2.2.1.9000   tidyverse_1.2.1    
## [13] pacman_0.4.6        
##
## loaded via a namespace (and not attached):
##  [1] reshape2_1.4.3    haven_1.1.1       lattice_0.20-35  
##  [4] colorspace_1.3-2  htmltools_0.3.6   yaml_2.1.16      
##  [7] utf8_1.1.3        rlang_0.1.6       pillar_1.1.0    
## [10] foreign_0.8-69    glue_1.2.0        modelr_0.1.1    
## [13] readxl_1.0.0      bindrcpp_0.2      bindr_0.1        
## [16] plyr_1.8.4        munsell_0.4.3     gtable_0.2.0    
## [19] cellranger_1.1.0  rvest_0.3.2       psych_1.7.8      
## [22] evaluate_0.10.1   labeling_0.3      knitr_1.19      
## [25] parallel_3.4.3    broom_0.4.3       Rcpp_0.12.15    
## [28] scales_0.5.0.9000 backports_1.1.2   jsonlite_1.5    
## [31] mnormt_1.5-5      hms_0.4.1         digest_0.6.15    
## [34] stringi_1.1.6     grid_3.4.3        rprojroot_1.3-2  
## [37] cli_1.0.0         tools_3.4.3       magrittr_1.5    
## [40] lazyeval_0.2.1    crayon_1.3.4      pkgconfig_2.0.1  
## [43] xml2_1.2.0        lubridate_1.7.1   assertthat_0.2.0
## [46] rmarkdown_1.8     httr_1.3.1        rstudioapi_0.7  
## [49] R6_2.2.2          nlme_3.1-131      compiler_3.4.3




https://blog.sciencenet.cn/blog-118204-1203797.html

上一篇:Nature重磅综述 |关于RNA-seq,你想知道的都在这
下一篇:cellassign:用于肿瘤微环境分析的单细胞注释工具(9月Nature)
收藏 IP: 43.228.36.*| 热度|

0

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...
扫一扫,分享此博文

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-4-20 09:38

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部