AI R 包生成的艺术照片 [3]
1822 年 7 月 20 日,现代遗传学之父孟德尔出生于奥地利帝国西里西亚海因策道夫村。2022 年是孟德尔诞辰 200 周年纪念。借用饶毅老师在他文章中的说法:生物学有两座智力高峰:第一次是 1854 年至 1866 年孟德尔独自一人;第二次是 1951 年至 1965 年克里克 (Francis Crick) 及其合作者们。两个高峰碰巧相隔一百年。今天重读孟德尔的论文,追寻孟德尔的思路,思考孟德尔的环境,仍然很有意义。
@wangdepin - 2022 年是孟德尔诞辰 200 周年,同时也是巴斯德诞辰 200 周年。孟德尔(Gregor Johann Mendel,1822-1884)发现了遗传学定律,找到了决定生命现象的本质;巴斯德(Louis Pasteur,1822-1895)开创了微生物学和免疫学,为人类的健康做出了巨大的贡献。很多学者写了纪念他们的文章,中国遗传学会也专门举办了一系列讲座来纪念这一重要日子,足见孟德尔在生命科学史上的重要地位。详细了解这些伟大科学家在当时所创造的一系列科研重大发现的过程,给我们这些后辈在科研路上带来很大的启发。
1、生信研究|Nat Mach Intell|基于 AI 算法预测基因组错义变异的功能影响
美国哥伦比亚大学系统生物学系和生物医学信息学系副教授沈宇锋博士及其团队前博士后张海仓,开发了一种新方法 gMVP 来预测哪些错义变异具有潜在功能影响。gMVP 使用最新的机器学习技术深度图注意力神经网络模型,来抽取相关特征并预测哪些变异具有功能影响。gMVP 方法使用蛋白质中氨基酸 - 氨基酸间的共进化信息来确定不同位置间是否在功能上相关,这使得 gMVP 不仅可以刻画变异所在的一维序列环境,也可以刻画变异所在的蛋白质三维结构环境。研究团队在多个不同的独立数据集上评估了 gMVP 的性能,涉及的应用包括临床基因测试以及致病新风险基因的发现。在所有测试中,gMVP 的表现明显优于其他方法。
2、生信研究 | 超越 Neural ODE,新机器学习模型显著提升计算速度与性能 [4]
近日,MIT 的研究人员在 Nature Machine Intelligence 杂志上发表论文,提出了一类新的机器学习模型 —— 闭合形式连续时间神经网络(Closed-form continuous-time neural networks,CfC),以闭合的形式逼近神经元和突触之间的相互作用。CfC 模型具有因果性、紧凑性和可解释性,在通过运动传感器识别人类活动,模拟步行机器人的物理动力学建模,以及基于事件的序列图像处理方面具有更快的速度和更好的性能。此外,模型还可以帮助建立具有数十亿细胞的大脑计算模型,为理解智能开启新的研究途径。
3、Clin Chem | PacBio 和 ONT 测序平台对血浆 cfDNA 分析性能比较成果
本研究比较了 PacBio 和 ONT 测序在血浆 cfDNA 分析中的应用,分析了来自不同妊娠期的女性、乙型肝炎病毒(HBV)携带者和 HCC 患者的血浆 cfDNA 样本。比较了两个平台的测序结果,包括大小和片段末端图谱,以及基于 cfDNA 单分子甲基化模式的组织来源分析。其中一个发现是,PacBio 测序的血浆 cfDNA 比 ONT 测序平台得到的更长,PacBio 中大于 1kb 的 cfDNA 片段比例是 ONT 的 30 倍左右。cfDNA 片段图谱中,cfDNA 短片段有 10 bp 的周期性峰,这在 PacBio 的数据中很明显,但在未来研究中,还是很有必要使用非测序为基础的方法进一步验证血浆中长片段 cfDNA 的存在。(整体上看 PacBio 在这里是有优势的)
4、Cancer Discov | 肝癌全基因组 cfDNA 片段化特征检测方法 DELFI,可高灵敏度、特异性筛查高危人群
约翰霍普金斯大学研究团队开发出一种基于血液的全基因组 cfDNA 片段化特征检测方法,对 HCC 具有高灵敏度和特异性。研究表明片段化概况捕获了基因组和染色质特征,包括已知在 HCC 中很重要的改变。cfDNA 片段化组分析方法 “DELFI” 是第一个在单独的高风险人群中独立验证的全基因组片段化分析,在检测 HCC 方面具有稳定和强大的性能,包括非常早期的疾病,且与疾病病因无关。
5、 20 个更有效地使用谷歌搜索的技巧 [5]
我们每天都在用 goole 搜索,学会一些小技巧更有利于搜索出更好的结果。
本文深入浅出介绍了 CDN 的概念、工作原理和缓存策略以及相关名字解释。
有人已经开发出 gpchatteR 包,和机器人聊聊天就把活给干了。
8、redis 入门
Redis 是一个开源(BSD 许可)的,内存中的数据结构存储系统,它可以用作数据库、缓存和消息中间件。本文将会从:Redis 使用场景与介绍 -> 数据结构与简单使用 -> 小功能大用处 -> 持久化、主从同步与缓存设计 -> 知识拓展 来进行介绍。
9、Scidown 文献下载工具 [6]
Scidown 是又一国产文献下载网页工具,注册账号后输入对应的 DOI 号就能获取大部分文献,感兴趣的小伙伴可以尝试一下~
10、哔哩下载姬(DownKyi)[7]
哔哩下载姬(DownKyi)是一个简单易用的哔哩哔哩视频下载工具,具有简洁的界面,流畅的操作逻辑。哔哩下载姬可以下载几乎所有的 B 站视频,并输出 mp4 格式的文件;采用 Aria 下载器多线程下载,采用 FFmpeg 对视频进行混流、提取音视频等操作。
11、cronologia - 创建交互性时间轴 [8]
cronologia 的目标是在 RMarkdown 文档和 Shiny 应用程序中创建一个交互式时间轴小部件。
12、R 包 - Sigminer[9]
Sigminer 是一个一站式的癌症基因组变异模式(Mutational Signature)分析工具,提供了对多种变异类型(SBS、DBS、INDEL、CNV、Rearrangement)和多种计算解析算法的支持(NMF、SigProfiler 等),可以通过 GitHub/CRAN/Bioconda/Docker 等途径下载和使用。
13、爱思唯尔出版社课程 | 成为有资质的审稿人 [10]
爱思唯尔出版社开设的关于如何成为一个合格的审稿人的课程,总共分为 12 个模块,总计约 4 小时左右。
14、 远程工作岗位资源推荐 [11]
一个 github 仓库以及网站,包含互联网相关公司远程工作或者半远程工作岗位。希望这样的岗位越来越多,特别是生信相关的。
15、人工智能领域基础概念和术语数据库 [12]
人工智能领域英中技术词汇的综合映射数据库。本术语库目前拥有专业术语约 2442 个、专项领域篇 2 篇,主要为人工智能领域基础概念和术语。
「Openbiox 生信周刊」运维小队:
@ShixiangWang
(王诗翔)@kkjtmac
(阚科佳)@NiEntropy
(赵启祥)@He-Kai-fly
(何凯)@JnanZhang
(张佳楠)@Tomcxf
(陈啸枫)@wangdepin
(王德品)[1]
ShixiangWang/weekly: https://github.com/ShixiangWang/weekly
[2]
「生信周刊讨论区」: https://github.com/ShixiangWang/weekly/discussions
[3]
AI R 包生成的艺术照片: https://github.com/cutterkom/generativeart
[4]
生信研究 | 超越 Neural ODE,新机器学习模型显著提升计算速度与性能: https://www.linkresearcher.com/theses/cd942fde-b3b4-496c-805d-603a6386ff0a
[5]
20 个更有效地使用谷歌搜索的技巧 : https://juejin.cn/post/6844903788520669191
[6]
Scidown 文献下载工具: https://www.scidown.cn/
[7]
哔哩下载姬(DownKyi): https://github.com/leiurayer/downkyi
[8]
cronologia - 创建交互性时间轴: https://github.com/feddelegrand7/cronologia
[9]
R 包 - Sigminer: https://github.com/ShixiangWang/sigminer
[10]
爱思唯尔出版社课程 | 成为有资质的审稿人: https://researcheracademy.elsevier.com/navigating-peer-review/certified-peer-reviewer-course
[11]
远程工作岗位资源推荐: https://github.com/remoteintech/remote-jobs
[12]
人工智能领域基础概念和术语数据库: https://github.com/jiqizhixin/Artificial-Intelligence-Terminology-Database