首页
学习
活动
专区
圈层
工具
发布
社区首页 >专栏 >数不胜数的单细胞文献全代码大放送

数不胜数的单细胞文献全代码大放送

作者头像
生信技能树
发布2022-06-08 19:54:28
发布2022-06-08 19:54:28
1.4K0
举报
文章被收录于专栏:生信技能树生信技能树

之前我们介绍过代码海洋,详见:《代码海洋-你想模仿的这里都有啊》,比如《单细胞天地》公众号分享的文献:单细胞转录组揭示肺腺癌特有的肿瘤微环境,就是配全部的代码。如下所示:

代码语言:javascript
复制
文章题目:Single-cell RNA sequencing reveals distinct tumor microenvironmental patterns in lung adenocarcinoma
日期:2021-10-18
期刊:Oncogene
链接:https://www.nature.com/articles/s41388-021-02054-3
代码:https://doi.org/10.24433/CO.0121060.v1

这个单细胞文献的项目的10x数据分析表达量矩阵,以及配套代码,甚至全部的图表,都是在公开可以学习的!它的价值对初学者来说,不可限量。每个人都可以下载它,打开代码,一行行学习和解读,甚至可以出一个自己的系列笔记。

当然了,我们团队自己也详细解读了其中几个,比如:CNS图表复现专辑第二波开启

大家的学习欲望非常强烈,总是会有留言希望我们推荐更多的这样的带有全套文章图表GitHub代码的文章。我们确实也收集整理了一些,比如:

  • Nature Medicine, 2020. https://www.nature.com/articles/s41591-020-0901-9
  • 一个网页工具来探索他们的单细胞数据集:https://cells.ucsc.edu/?ds=covid19-balf
  • 全部的R代码也是公开的:https://github.com/zhangzlab/covid_balf

但是我们团队自己这样的收集整理效率太多了,恰好在朋友圈看到了一个神器:https://paperswithcode.com/

不过我测试了一下, 如果我们仅仅是输入关键词,比如:single cell ,很容易搜到的都是各式各样的算法和软件,因为它们这样的工具发表一般来说默认就会公布代码,但是我们初学者并不需要看这样的代码。

所以大家可以把关键词细化一点, 比如:single cell tumor,或者想其它办法吧。反正我试了一下,它搜索出来的东西并不是我想要的,如果是为了看各式各样的单细胞工具算法源代码,还不如直接去看每个算法领域的综述,它综述都会详细的列出来几十个工具的GitHub代码,比这个方便太多了。

那有没有可能我们就直接谷歌或者其它搜索引擎直接检索呢?如下所示的格式整理:

  • GitHub链接:
  • 文章链接:
  • 数据链接:
  • 其它链接:

当然了,如果是要看文献图表全部代码,目前只能说看运气了,前面介绍过代码海洋,详见:《代码海洋-你想模仿的这里都有啊》的图表其实很有限的,我们能做的就是组建一个交流群,大家在里面共享自己无意中看到的各种好文献代码咯,比如:

  • 于2021年7月27日发表在Nature Communications上的”Single-cell transcriptome of bronchoalveolar lavage fluid reveals sequential change of macrophages during SARS-CoV-2 infection in ferrets“
  • All the custom codes used in this study are available at Github and Zenodo ( https:// github.com/kijong-yi/SARS-CoV-2_Ferret_BAL )

当然了,并不是所有的代码都是基于R和rmd的数据分析和可视化路线,也有全部基于Python的:

  • GitHub链接:https://github.com/zhiyhu/scFT-paper
  • 文章链接:(2020). The repertoire of serous ovarian cancer non-genetic heterogeneity revealed by single-cell sequencing of normal fallopian tube epithelial cells. Cancer Cell. https://doi.org/10.1016/j.ccell.2020.01.003
  • 数据链接:All Rmd and Rdata can be downloaded from https://figshare.com/s/ed717cd5deca61308f98.
  • 其它链接:A video explaining the biomedical finding of our work at https://youtu.be/AwKZVEtzjhs

任意一个代码都抵得上你看到的绝大部分生物信息学相关公众号的全部教程,而且是系统性的,直达文章发表的数据处理及可视化技巧哦。当然了,需要你有计算机基础知识 ,我把它粗略的分成基于R语言的统计可视化,以及基于Linux的NGS数据处理

把R的知识点路线图搞定,如下:

  • 了解常量和变量概念
  • 加减乘除等运算(计算器)
  • 多种数据类型(数值,字符,逻辑,因子)
  • 多种数据结构(向量,矩阵,数组,数据框,列表)
  • 文件读取和写出
  • 简单统计可视化
  • 无限量函数学习

Linux的6个阶段也跨越过去 ,一般来说,每个阶段都需要至少一天以上的学习:

  • 第1阶段:把linux系统玩得跟Windows或者MacOS那样的桌面操作系统一样顺畅,主要目的就是去可视化,熟悉黑白命令行界面,可以仅仅以键盘交互模式完成常规文件夹及文件管理工作。
  • 第2阶段:做到文本文件的表格化处理,类似于以键盘交互模式完成Excel表格的排序、计数、筛选、去冗余、查找、切割、替换、合并、补齐,熟练掌握awk、sed、grep这文本处理的三驾马车。
  • 第3阶段:元字符,通配符及shell中的各种扩展,从此linux操作不再神秘!
  • 第4阶段:高级目录管理:软硬链接,绝对路径和相对路径,环境变量。
  • 第5阶段:任务提交及批处理,脚本编写解放你的双手。
  • 第6阶段:软件安装及conda管理,让linux系统实用性放飞自我。

我一个人的力量仍然是有限的,努力的回忆了这些年看过的单细胞文献里面自带GitHub图表复现代码及数据集的部分,进行了如下所示的整理:

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2022-04-23,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 生信技能树 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档