Loading [MathJax]/jax/output/CommonHTML/config.js
前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >「R」使用yyplot绘制pubmed研究趋势

「R」使用yyplot绘制pubmed研究趋势

作者头像
王诗翔呀
发布于 2020-07-02 13:41:10
发布于 2020-07-02 13:41:10
88310
代码可运行
举报
文章被收录于专栏:优雅R优雅R
运行总次数:0
代码可运行

在准备转博报告的过程中觉得有必要给一些研究添加Pubmed研究趋势,这个功能Y叔在它的公众号推过,所以我记了一下,之前在写开题报告的时候就用了下。今天又重新操作了一番,感觉非常不错,记录一下分享,说不定某些同胞需要。

Y叔把这个功能整合在yyplot包中,该包发布在Github上,所以我们需要用devtools包进行安装:

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
install.packages("devtools")
devtools::install_github("GuangchuangYu/yyplot")

这两个包的安装都有不少依赖包,所以大家安装的时候需要注意下。如果有解决不了的问题,欢迎在下方留言讨论。

Y叔的厉害之处在于它对于ggplot2包的理解非常深,写出包和结果对象基本都直接可以用ggplot展示,或者直接用plot绘制可以得到类似的显示效果。

这里以我探究非小细胞癌、小细胞癌和肺腺癌最近一些年发表的文章数为例子:

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
library(yyplot)
library(ggplot2)
# 键入你要搜索的关键字
term <- c("Lung Adenocarcinoma", "NSCLC", "SCLC")
# 进行检索,指定起止年
pm   <- pubmed_trend(term, year=2001:2019)
#> search term: Lung Adenocarcinoma
#> -> querying year 2001
#> -> querying year 2002
#> -> querying year 2003
#> -> querying year 2004
#> -> querying year 2005
#> -> querying year 2006
#> -> querying year 2007
#> -> querying year 2008
#> -> querying year 2009
#> -> querying year 2010
#> -> querying year 2011
#> -> querying year 2012
#> -> querying year 2013
#> -> querying year 2014
#> -> querying year 2015
#> -> querying year 2016
#> -> querying year 2017
#> -> querying year 2018
#> -> querying year 2019
#> search term: NSCLC
#> -> querying year 2001
#> -> querying year 2002
#> -> querying year 2003
#> -> querying year 2004
#> -> querying year 2005
#> -> querying year 2006
#> -> querying year 2007
#> -> querying year 2008
#> -> querying year 2009
#> -> querying year 2010
#> -> querying year 2011
#> -> querying year 2012
#> -> querying year 2013
#> -> querying year 2014
#> -> querying year 2015
#> -> querying year 2016
#> -> querying year 2017
#> -> querying year 2018
#> -> querying year 2019
#> search term: SCLC
#> -> querying year 2001
#> -> querying year 2002
#> -> querying year 2003
#> -> querying year 2004
#> -> querying year 2005
#> -> querying year 2006
#> -> querying year 2007
#> -> querying year 2008
#> -> querying year 2009
#> -> querying year 2010
#> -> querying year 2011
#> -> querying year 2012
#> -> querying year 2013
#> -> querying year 2014
#> -> querying year 2015
#> -> querying year 2016
#> -> querying year 2017
#> -> querying year 2018
#> -> querying year 2019
# 绘图
plot(pm) + theme_bw()

检索返回的结果可以直接用plot绘制,这里因为我需要添加bw主题,所以导入了ggplot2包,不然可以不使用该包

注意纵坐标是一个比例,该关键字发表文章数与当年文章总数的比例值,我们也可以灵活一点,只绘制发表文章数目:

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
ggplot(pm, aes(x=year, y=number, color=TERM)) + 
    geom_point() + geom_line() + theme_bw() + 
    xlab("Year") + ylab("Number of Publication per Year")

简单吧?感觉作者本身应该还有其他的设计,不过这已经足够我用了。有兴趣大家不妨深入探索一番。

比如它也可以用它来画出某个研究人员,历年来发表文章的数目,比如想看Y叔每年发多少篇文章,下面这行代码给你答案:

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
pubmed_trend("Yu Guangchuang[Full Author Name]", 2010:2019)
本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2019-12-08,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 优雅R 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
1 条评论
热度
最新
请问报错: 没有"pubmed_trend"这个函数,应该怎么解决呀,R小白
请问报错: 没有"pubmed_trend"这个函数,应该怎么解决呀,R小白
回复回复点赞举报
推荐阅读
编辑精选文章
换一批
R可视化:R可视化教程来了!
从本周开始会每周推送1~2次高质量R可视化内容,本系列内容来自github上面超级火爆的R语言可视化项目:tidyTuesday。tidyTuesday每周更新数据,大佬们会使用这些数据集自由创作出各种高质量的R语言可视化作品,是学习R语言数据分析和可视化极好的素材。
医学和生信笔记
2022/11/15
6210
R可视化:R可视化教程来了!
用python对汽车油耗进行数据分析(anaconda python3.6完全跑通)
编者按:前两天我们微信发了一篇文章《用python对汽车油耗进行数据分析》,有一网友学习后用python3.6重新跑了一下数据,请大家比较阅读。PPV课致力于为大家提供一个开放、分享、进步的数据科学社区,欢迎小伙伴们给我们分享你的学习心得和博客文章,有你的鼓励和支持,我们会做的更好。投稿请联系QQ149104196。 正文: 1.下载汽车油耗数据集并解压 下载地址:https://www.fueleconomy.gov/feg/download.shtml vehiclesData.py: #encodi
小莹莹
2018/04/23
1K0
用python对汽车油耗进行数据分析(anaconda python3.6完全跑通)
多年暴雨tif数据集合成为一个nc数据
当处理多年暴雨的 TIF 数据集时,我们可以使用 rioxarray 库将这些数据合成为一个 NetCDF (nc) 文件。NetCDF 是一种常用的科学数据格式,它具有跨平台、可扩展和自描述的特点,非常适合存储和共享地理空间数据。
用户11172986
2024/06/20
4020
多年暴雨tif数据集合成为一个nc数据
R可视化:动态热力地图
本系列内容来自github上面超级火爆的R语言可视化项目:tidyTuesday。是学习R语言数据分析和可视化极好的素材。
医学和生信笔记
2023/02/14
8650
R可视化:动态热力地图
【数据分析与可视化】Pandas Dataframe
import numpy as np import pandas as pd from pandas import Series, DataFrame # 引入网页 import webbrowser link = 'https://www.tiobe.com/tiobe-index/' webbrowser.open(link) True # 获取剪贴板数据 df = pd.read_clipboard() df Year Winner 2019 medal C 2018 medal Python 2
瑞新
2020/07/07
4130
PIE-engine 教程 ——提取黄河流域/山西省1980—2018年流域降水量并对比分析
这里面我们首先要上传我们自己的研究区,然后加载每一年的数据降水数据,通过系数转化,完成正常降水量的展示,我们通过对reduceregion的统计,分别算出平均降水量,分辨率设定为1000米,最后加载影像的chart折线图,用于存放坐标横轴时间和纵轴的对象(降水),这里我们首先看一下降水数据
此星光明
2024/02/02
2420
PIE-engine 教程 ——提取黄河流域/山西省1980—2018年流域降水量并对比分析
左右用R右手Python9——字符串合并与拆分
在文本处理和数据清洗阶段,对字符串或者字符型变量进行分割、提取或者合并虽然谈不上什么高频需求,但是往往也对很重要的。 接下来跟大家大致盘点一下在R语言与Pyhton中,常用的字符串分割与合并的函数。 R语言: 字符串向量: 针对向量: strsplit #针对字符串向量(拆分) str_split #针对字符串向量(拆分)stringr包内函数 paste #针对向量合并 针对数据框: unite #合并数据框中的某几列 separate #将数据框中某一列按照某种模式拆分成
数据小磨坊
2018/04/11
1.6K0
python list.remove的坑
那是因为list的遍历是基于下标的,当你删除其中的一个元素的时候,列表实际上已经发生了变化,该元素后面的所有元素都往前移动了一个位置,所以下次遍历的时候就会跳过该元素后面的一个元素。
葫芦
2019/04/17
9810
应用Python统计公司年报中指定词出现的次数
本文背景是大学关系很好的老师最近在做文本挖掘相关的项目,想要我用Python帮她实现公司年报中某些词出现次数的统计。
阿黎逸阳
2023/10/20
2570
应用Python统计公司年报中指定词出现的次数
一文读懂参考基因组和基因组注释+最全下载方法
自从 1990 启动的家喻户晓的人类基因组计划开始,全世界的科学家竭尽全力破译了第一个完整的人类基因组,从那时开始人类拿到了一本只有 ATCG 四个碱基书写的天书。后续人们逐步完善了基因组序列信息,并写在 Fasta 格式的文本文件“天书”中,这本天书就叫做参考基因组。
白墨石
2021/06/10
3.3K0
一文读懂参考基因组和基因组注释+最全下载方法
时间序列 | 时期(Period)及其算术运算
你可以将Period('2012','A-DEC')看做一个被划分为多个月度时期的时间段中的游标。下图对此进行了说明在将高频率转换为低频率时,超时期(superperiod)是由子时期(subperiod)所属的位置决定的。
数据STUDIO
2021/06/24
1.2K0
Google Earth Engine ——MOD16A2 V105产品以1公里的像素分辨率提供8天的全球陆地蒸发量(ET)信息
The MOD16A2 V105 product provides information about 8-day global terrestrial evapotranspiration at 1km pixel resolution. Evapotranspiration (ET) is the sum of evaporation and plant transpiration from the Earth's surface to the atmosphere. With long-term ET data, the effects of changes in climate, land use, and ecosystems disturbances can be quantified.
此星光明
2024/02/02
1520
Google Earth Engine ——MOD16A2 V105产品以1公里的像素分辨率提供8天的全球陆地蒸发量(ET)信息
80 - 抓取豆瓣音乐排行榜
使用自己熟悉的网络库和分析库,实现抓取豆瓣音乐Top250排行榜的数据,并将数据保存在csv文件中 更多爬虫教学及案例可查看我 “Python爬虫” 专栏 ''' https://music.doub
ruochen
2021/06/14
1.1K0
80 - 抓取豆瓣音乐排行榜
这么牛X的包,一般人我不告诉他!!!
本文将给大家介绍一个ggplot2灰常牛X的可视化扩展包,我将该包主页的包用法介绍整理成中文,分享给大家。 包名叫geofacet,有经验的charter大概能猜出来个大概,没错该包是关于可视化数据中的地理信息,以及维度分面。 作者命名非常讲究,将该包的两个主要核心功能进行组合命名。 地理信息可视化分面,这么吊的包你肯定是第一次看到吧(其实之前介绍过一些地图上的mini 柱形图、饼图等都算这一类),但是这里的分面功能做的更加彻底,作者还是遵循惯例,将这种基于地理信息分面的可视化功能对接了ggplot2,并
数据小磨坊
2018/04/11
8000
这么牛X的包,一般人我不告诉他!!!
Google Earth Engine(GEE) ——2000-2021年地球非洲海岸线数据集
数字地球非洲海岸线 数字地球非洲海岸线是一个大陆数据集,包括整个非洲海岸线的年度海岸线和海岸变化率。这是一项临时服务,已经生成了2000年至2021年的数据,我们希望与用户一起改进和操作。
此星光明
2024/02/02
2010
Google Earth Engine(GEE) ——2000-2021年地球非洲海岸线数据集
一文入门数分三剑客--Numpy、Pandas、Matplotlib
Numpy Pandas 和 Matplotlib 是数据分析领域著名的三大模块,今天我们来一起学习下这三剑客
周萝卜
2021/10/13
3.8K0
一文入门数分三剑客--Numpy、Pandas、Matplotlib
实验2 比例可视化之堆叠柱状图
版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/wpxu08/article/details/89384861
步行者08
2019/05/05
7750
实验2 比例可视化之堆叠柱状图
关于flask入门教程-ajax+echarts实现热力图
热力图 (Heatmap) 通过色彩变化来显示数据,热力图适合用来交叉检查多变量的数据。显示是否有彼此相似的变量;以及检测彼此之间是否存在任何相关性。也可以展现随着时间的变化指标的发展。
python与大数据分析
2022/03/11
4130
关于flask入门教程-ajax+echarts实现热力图
老板喊你调研文献?推荐你用R包软件②pubmed.mineR
R包安利 ② pubmed.mineR—又一个PubMed利器 https://mp.weixin.qq.com/s/bndecTSABox2dcr7aoheig
生信菜鸟团
2023/09/09
5950
老板喊你调研文献?推荐你用R包软件②pubmed.mineR
RTS人工智能研究的历史
在过去十年中,研究人员已经从单独研究RTS游戏的不同人工智能技术,转变为更加复杂的游戏中的合作与竞争,不同的技术进行了对比。为了使这项工作取得成功,以下条件是必要的: • 为研究人员开发和评估机器人开放的API • 比赛使研究人员能够比较不同的技术 • 重放学习算法用于培训 • 人类对手评估机器人的表现 这些条件大部分是在2009年发布了母巢战API的,但是这个平台的封闭性让研究人员对AI系统的训练过程实现自动化具有挑战性。随着星际争霸2开放环境的公布,研究人员将有很大机会在RTS游戏中开发具有专家级性能的
刀刀老高
2018/04/10
1.3K0
RTS人工智能研究的历史
推荐阅读
相关推荐
R可视化:R可视化教程来了!
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档
本文部分代码块支持一键运行,欢迎体验
本文部分代码块支持一键运行,欢迎体验