分析方法的工作流程
图片说明
◉ 这是研究中进行的分析研究的工作流程图。
数据集描述
差异表达基因分析
基因集富集分析
从蛋白质-蛋白质相互作用网络中识别瓶颈蛋白
基因调控网络的分析
药物和化学物质的预测
生存分析
建立模型
image
image
image
image
image
image
差异表达基因的识别
图片说明
◉ 图2 差异表达基因的火山图。差异表达基因是基于标准筛选的,下调基因的对数倍变化(LogFC)<1且上调基因的对数倍变化(LogFC)>1,同时P值<0.05。
- 图片说明
◉ 表1 乳腺癌中上调和下调的前10个差异表达基因。
image
蛋白质相互作用分析
图片说明
◉ 图3 是 BRCA 的前10个上调基因和前10个下调基因的蛋白质相互作用网络。较大的不同颜色的圆圈代表前4个枢纽蛋白。
信号和基因本体术语的识别
- 图片说明
◉ 表2 BRCA中获得的DEGs的前10条信号通路。
image
- 图片说明
◉ 表3 BRCA中获得的DEGs的前10个基因本体术语。
image
差异表达基因——微RNA和转录因子——基因相互作用的识别
图片说明
◉ 图4 miRNA-基因相互作用调控网络。目标调控分子由方形节点表示,而相关基因为圆形节点。◉ Target regulatory molecules are represented by square nodes, while associated genes are represented by circular nodes.
图片说明
◉ 图5 TF-基因相互作用调控网络。方形节点表示目标调控分子(TFs),圆形节点代表相关的DEGs。
蛋白质-药物和蛋白质-化学相互作用的鉴定
图片说明
◉ 图6 结合的蛋白质-药物和蛋白质-化学物质相互作用网络。五角星节点表示化学化合物,菱形节点表示药物调控分子。◉ Pentangle 节点表示化学化合物。◉ rhombus 节点表示药物调控分子。
生存分析结果
图片说明
◉ 图7 ACTL8、CGA、IBSP和MUC2基因的整体生存率。
不同机器学习模型的结果
- 图片说明
◉ 表4 模型评估指标。
image
图片说明
◉ 图8是随机森林、高斯朴素贝叶斯、K近邻和支持向量机(XGBoost)机器学习模型的精确率-召回曲线。
图片说明
◉ 图9展示了机器学习模型RF、GNB、KNN和XGB的ROC曲线。