首页
学习
活动
专区
工具
TVP
发布

生信探索

生信探索
专栏成员
74
文章
51618
阅读量
16
订阅数
100个GEO基因表达芯片或转录组数据处理之GSE126848(003)
虽然现在是高通量测序的时代,但是GEO、ArrayExpress等数据库储存并公开大量的基因表达芯片数据,还是会有大量的需求去处理芯片数据,并且建模或验证自己所研究基因的表达情况,芯片数据的处理也可能是大部分刚学生信的道友入门R语言数据处理的第一次实战,因此准备更新100个基因表达芯片或转录组高通量数据的处理。
生信探索
2024-01-11
250
Julia编程12:文件系统
把pkg.csv链接到上层目录,上层目录不能存在名为pkg.csv的文件否则报错。
生信探索
2023-05-29
2961
01.GATK肿瘤基因变异最佳实践SnakeMake流程:WorkFlow简介
GATK best practices workflow Pipeline summary
生信探索
2023-05-29
3040
GATK最佳实践之数据预处理SnakeMake流程
写的数据预处理snakemake流程其实包括在每个单独的分析中比如种系遗传变异和肿瘤变异流程中,这里单独拿出来做演示用,因为数据预处理是通用的,在call变异之前需要处理好数据。
生信探索
2023-05-27
3840
01.GATK人种系变异最佳实践SnakeMake流程:WorkFlow简介
学习的第一个GATK找变异流程,人的种系变异的短序列变异,包括SNP和INDEL。写了一个SnakeMake分析流程,从fastq文件到最后的vep注释后的VCF文件,关于VCF的介绍可以参考上一篇推文基因序列变异信息VCF (Variant Call Format)
生信探索
2023-05-26
4260
Python实现将Excel表格按某列拆分为多个sheet
实际数据分析中遇到需求,把某个Excel表格按照某一列分为多个sheet,并且要求如果某个key对应的行数较少应该合并到一个sheet中。
生信探索
2023-05-24
6030
Pandas数据框去重复(AB、BA类型)
从string-db下载蛋白质相互作用的信息,在处理时发现蛋白A与B互作被记录了两次比如下边的例子(即AB、BA)
生信探索
2023-05-24
5670
04.Python Dash网页开发:ubuntu服务器部署DASH网站(uWSGI+nginx)
并且需要再app.py文件最后一行加上,因为wsgi从app.py中导入并运行的是server
生信探索
2023-05-23
7690
RNA-seq上下游分析snakemake流程
学习完snakemake后写的第一个流程是RNA-seq上游定量和下游的质控和差异分析。
生信探索
2023-05-23
3310
使用snakemake编写生信分析流程
The Snakemake workflow management system is a tool to create reproducible and scalable data analyses. Workflows are described via a human readable, Python based language. They can be seamlessly scaled to server, cluster, grid and cloud environments, without the need to modify the workflow definition. Finally, Snakemake workflows can entail a description of required software, which will be automatically deployed to any execution environment.
生信探索
2023-05-23
7740
基因序列变异信息VCF (Variant Call Format)
VCF是Variant Call Format的简称,是一种定义的专门用于存储基因序列突变信息的文本格式。在生物信息分析中会大量用到VCF格式。例如基因组中的单碱基突变,SNP, 插入/缺失INDEL, 拷贝数变异CNV,和结构变异SV等,都是利用VCF格式来存储的。将其存储为二进制格式就是BCF。
生信探索
2023-05-23
6540
Hello World感知机,懂你我心才安息
https://mp.weixin.qq.com/mp/appmsgalbum?__biz=Mzg5MDg4MDU4MQ==&action=getalbum&album_id=279751747564
生信探索
2023-05-06
1060
山重水复疑无路,最快下降问梯度
之前的推文中使用最小二乘法求损失函数的最小值,但是在机器学习和深度学习中更通用的方法是使用梯度下降方法找到最优解。
生信探索
2023-05-06
970
统计学03: 泊松分布和指数分布
https://mp.weixin.qq.com/mp/appmsgalbum?__biz=Mzg5MDg4MDU4MQ==&action=getalbum&album_id=290255439476
生信探索
2023-05-06
1830
统计学01: 中心极限定律、正态分布、z-score
https://mp.weixin.qq.com/mp/appmsgalbum?__biz=Mzg5MDg4MDU4MQ==&action=getalbum&album_id=290255439476
生信探索
2023-05-06
3160
统计学02: 二项分布
发生r次的概率$P(x=r)=C_{n}^{r} p^{r}(1-p)^{n-r}$
生信探索
2023-05-06
980
monocle3轨迹分析
https://mp.weixin.qq.com/s/UsDC-t1j7NHaLTnI6xCATQ
生信探索
2023-04-27
1.3K0
monocle3轨迹分析
https://mp.weixin.qq.com/s/UsDC-t1j7NHaLTnI6xCATQ
生信探索
2023-04-23
6790
CellChat 细胞通讯分析(可视化)
预处理见上一篇推文https://mp.weixin.qq.com/s/ZsUQogkqcPXkaNDIV8GhWg,本篇内容是合并两个处理好的CellChat对象,然后进行对比分析和可视化,因为有许多细节需要手动调整所以就不写成脚本了。
生信探索
2023-04-21
1.6K0
CellChat 细胞通讯分析(预处理)
https://mp.weixin.qq.com/s/ZsUQogkqcPXkaNDIV8GhWg
生信探索
2023-04-21
7990
点击加载更多
社区活动
【纪录片】中国数据库前世今生
穿越半个世纪,探寻中国数据库50年的发展历程
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档