官方文档:https://www.scipy.org/ \qquad https://docs.scipy.org/doc/scipy/reference/index.html
nii.gz格式是医学图像常用的压缩格式,python中可用nibabel和sitk来读取保存。
文件的可执行属性和环境变量 Linux下文件有一个特殊的属性即可执行属性,用来指示这个文件是一个可执行的脚本或可以运行的二进制文件。前面所提到的这些命令,都具有可执行属性。 which: 表示查看命令的路径。一般用于当我们想知道使用的命令来源于什么地方时,比如安装了多个R或多个python,但又分不清用的是哪个时,which一下,立即明了。在这儿我们用which获取的是可执行的命令所在的路径,进而查看其属性。 ct@iZ8vb3e9jtel4m99ss6e7eZ:~$ ls -l "`which cd`"
Dicom文件包含了诸多的元数据信息(比如像素尺寸,每个维度的一像素代表真实世界里的长度),Dicom文件即文件后缀为.dcm的文件。
于是我找到了xlsxwriter这个模块,它生成的文件后缀名为.xlsx,最大能够支持1048576行数据,16384列数据
本篇文章将是本系列文章的最后一篇。本专题将iOS中有关Machine Learning的相关内容做了整体梳理。下面是专题中的其他文章地址,希望如果你有需要,本专题可以帮助到你。
Linux学习系列文章是生信宝典最开始主推的一块,力图从一个新额视角帮助初学者快速入门Linux系统,熟悉Linux下的文件和目录,文件操作, 文件内容操作。而且教程摒弃了完美操作,列举出常见错误和解决方式,管道、标准输入输出解惑Linux下多种信息输出方式。 在文件排序和FASTA文件操作中简述了awk和sed的使用,作为一个引子。本篇则详细列举关于awk常用的操作和一些偏门的操作。 awk基本参数解释 awk擅长于对文件按行操作,每次读取一行,然后进行相应的操作。 awk读取单个文件时的基本语法格式是a
reportlab是Python的一个标准库,可以画图、画表格、编辑文字,最后可以输出PDF格式。它的逻辑和编辑一个word文档或者PPT很像。有两种方法:
利用深度学习技术,分析图像与视频,并且将之应用在诸如自动驾驶,无人机等等领域已经成为最新研究方向。在最新的一篇名为“A Neural Algorithm of Artistic Style”[1508.06576] A Neural Algorithm of Artistic Style中,作者描述了一种新的方式,从艺术作品中获得,并且应用到图像中,生成新的图像。另外,在 “Generative Adversarial Networks” [1406.2661] Generative Adversarial Networks(GAN) and “Wasserstein GAN” https://arxiv.org/pdf/1701.07875.pdf文章中,作者提出了新的模型,这些模型能够生成,类似于我们给出的原始数据。至此开启了半监督学习的新世界,并且为半监督学习铺平了道路。
环境变量的补充 PATH只是众多环境变量中的一个变量,用于存储可执行文件所在的目录,以便在用户输入命令时可以查询的到。尤其是自己写的脚本或安装的程序,系统不会知道它们在哪个路径下,需要我们去提供给系统这些新的路径,学名叫设置环境变量。 此外常用到的环境变量还有LD_LIBARY_PATH: 指定动态链接库 (so文件)的位置,一般在安装软件出错时会用到;PYTHONPATH: 指定Python的安装包的路径;PERL5LIB: 指定perl的安装包的路径。 设置环境变量要注意2点:1. 设置新的环境变量时一
在23年3月份的时候(下意识想说今年了hhh,恍然发现已经24年),菜鸟团作者就整理过不同格式的单细胞数据读取的方法,是基于V4版本的。
毕竟在文章《A scalable SCENIC workflow for single-cell gene regulatory network analysis》,有这个时间消耗对比,不服不行!
为了能够在Labelme上对Dicom图像进行编辑,这里对python环境下Dicom文件的读取进行了研究。在Dicom图像中CT的窗宽窗位是一个很重要的概念,但是找了半天在pydicom中没有相关设置函数,这里跟DCMTK还不一样。但是可以根据两个tag得到CT图像的CT值,那就是(0028|1052):rescale intercept和(0028|1053):rescale slope。则按照下面的算子得到CT图像,进而就可以调整窗宽窗位了
但是留下来了一个悬念, 就是如果我们的单细胞转录组并不是10x的标准3文件,而是tsv或者csv或者txt等文本文件表达量矩阵信息,就有点麻烦了。接下来我们以2020的文章:《Single-Cell Transcriptome Analysis Reveals Dynamic Cell Populations and Differential Gene Expression Patterns in Control and Aneurysmal Human Aortic Tissue》举例说明,它的数据集是 https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GSE155468
DICOM(Digital Imaging and Communications in Medicine)即医学数字成像和通信,是医学图像和相关信息的国际标准(ISO 12052)。它定义了质量能满足临床需要的可用于数据交换的医学图像格式,可用于处理、存储、打印和传输医学影像信息。DICOM可以便捷地交换于两个满足DICOM格式协议的工作站之间。目前该协议标准不仅广泛应用于大型医院,而且已成为小型诊所和牙科诊所医生办公室的标准影像阅读格式。 DICOM被广泛应用于放射医疗、心血管成像以及放射诊疗诊断设备(X
有时候为了方便起见,就算某个键在映射里不存在,我们也希望在通过 这个键读取值的时候能得到一个默认值。有两个途径能帮我们达到这个目的,一个是通过 defaultdict,这个类型而不是普通的 dict,另一个 是给自己定义一个 dict 的子类,然后在子类中实现 __missing__ 方法。
因为之后的项目要用到影像聚类,之前一直是用ENVI实现,现在想学下python。 学习的这一篇:小项目聚类
临时文件在python项目中时常会被使用到,其作用在于随机化的创建不重名的文件,路径一般都是放在Linux系统下的/tmp目录。如果项目中并不需要持久化的存储一个文件,就可以采用临时文件的形式进行存储和读取,在使用之后可以自行决定是删除还是保留。
文章标题:《Single-cell analysis supports a luminal-neuroendocrine transdifferentiation in human prostate cancer》
本套课程正式进入Python爬虫阶段,具体章节根据实际发布决定,可点击【python爬虫】分类专栏进行倒序观看: 【重点提示:请勿爬取有害他人或国家利益的内容,此课程虽可爬取互联网任意内容,但无任何收益,只为大家学习分享。】 开发环境:【Win10】 开发工具:【Visual Studio 2019】 Python版本:【3.7】 总是版权问题,我就尽量删掉网站上的截图了,主要内容都在编码中。 目标:【更多-->音乐-->音乐页面】 1、查找目标位置: 📷 播放的路径:【https://audio04.d
之前介绍过Luna16肺结节检测竞赛的情况,接下来会做一系列项目的具体实现过程。首先附上该项目的Github链接:https://github.com/Minerva-J/DeepLung。
SQLite 是非常优秀的数据库,能够在真实的生产环境中完成一些真正的工作。本文将列出五个我认为在2016年应当选用 SQLite 的原因。 便于管理 不知你是否管理过 Postgres 数据库?想要
上一节我们理解了业务,也就是我们这个项目到底要做什么事情,并定好了一个方案。这一节我们就开始动手了,动手第一步就是把数据搞清楚,把原始数据搞成我们可以用PyTorch处理的样子。这个数据不同于我们之前用的图片数据,像之前那种RGB图像拿过来做一些简单的预处理就可以放进tensor中,这里的医学影像数据预处理部分就要复杂的多。比如说怎么去把影像数据导入进来,怎么转换成我们能处理的形式;数据可能存在错误,给定的结节位置和实际的坐标位置有偏差;数据量太大我们不能一次性加载怎么处理等等。今天理解数据这部分处理的就是之前整个项目框架图的第一步,关于数据加载的问题。
微软对 Rust 的热爱是怎么回事? 就在前天【6月2号】,Rust 进入了 TIOBE 指数的前 20 名,它从第 38 位跃升到第 20 位,跃升了惊人的 18 位,这其实是挺罕见的。于是 Vis
列表是一种特别的对象集合,它的元素也由序号(下标)区分,但是各元素的类型可 以是任意对象,不同元素不必是同一类型。元素本身允许是其它复杂数据类型,比如,列表 的一个元素也允许是列表。例如:
前段时间,我发了一篇关于《pdf里的表格数据也能轻松汇总了!》的文章,其中主要介绍了用Power BI直接汇总pdf文件中的数据的方法。
ct 是一款使用 rust 语言进行开发,并且基于 ZoomEye 域名查询以及利用域名字典进行子域名爆破的工具,同时在最终爆破完成后,自动生成 Windows/*nix 下的可执行脚本。脚本内容为自动将相应的的.gv 文件转化成为相应的 .png 文件,graphviz 下载安装请参见 https://graphviz.org/download/,支持在Windows/Linux/Mac上使用。
LSTM(Long Short Tem Memory)特殊递归神经网络,神经元保存历史记忆,解决自然语言处理统计方法只能考虑最近n个词语而忽略更久前词语的问题。用途:word representation(embedding)(词语向量)、sequence to sequence learning(输入句子预测句子)、机器翻译、语音识别等。
生物信息领域常用语言 个人认为:是否能熟悉使用Shell(项目流程搭建)+R(数据统计与可视化)+Perl/Python/Java..(胶水语言,数据格式转换,软件间衔接)三门语言是一位合格生物信息工程师的标准。 生物信息常用语言非常广泛,我常用的有Perl, R, Shell,此外参与网页制作还用过PhP+mySQL,写博客用Markdown。这些其实都是非常小众的语言,如果和计算机专业的人交流,对方可能没听过这些语言。本系列“生信人写程序”主要以Perl为主,并伴随一些零星的R和Shell编程的经验和
Python网络请求的类在urllib中,我们这次只需要用request。发出请求,获取响应:
【AI100 导读】当下深度学习的研究领域仍然停留在通用图像的层面上,但我们的目标是将这些研究应用于医学图像,提升医疗保健行业的服务水平。在这篇文章中,作者会从图像处理的基础知识、医学图像格式方面的基
通过手把手教你使用Python抓取QQ音乐数据(第一弹)我们实现了获取 QQ 音乐指定歌手单曲排行指定页数的歌曲的歌名、专辑名、播放链接。
在tkinter里有三种布局管理,分别是pack、grid、和place,这三种方式各有各的好处,需要注意的是这三种布局管理在同一个父容器里面一定不能混用,在一个父容器里选择一种方式便足够了。
今天将分享CT图像上的颅内出血检测和分割完整实现版本,为了方便大家学习理解整个流程,将整个流程步骤进行了整理,并给出详细的步骤结果。感兴趣的朋友赶紧动手试一试吧。
flag{4d65dc12-1a22-4567-96c1-0478057c3932}
lasturl为时间戳,精确到后三位小数的时间戳,构造这个时间戳,后三位小数我就随机生成一个三位数了:
Linux下的标准输入、输出、重定向、管道 在Linux系统中,有4个特殊的符号,<, ‘>’, ‘|’, ‘-‘,在我们处理输入和输出时存在重要但具有迷惑性的作用。 默认Linux的命令的结果都是输出到标准输出,错误信息 (比如命令未找到或文件格式识别错误等) 输出到标准错误,而标准输出和标准错误默认都会显示到屏幕上。 >表示重定向标准输出,> filename就是把标准输出存储到文件filename里面。标准错误还是会显示在屏幕上。 2 >&1 表示把标准错误重定向到标准输出。Linux终端用2表示标准
文章标题:《Cerebrospinal fluid immune dysregulation during healthy brain aging and cognitive impairment》
GT911、GT928、GT9147都属于GT9系列非单层多点触控芯片,他们支持的触控点数不同(GT928支持10个点、GT911支持5个点)、驱动和感应通道也可能不同。可是他们的寄存器和IIC通讯时序是相同的,也就是说驱动程序是兼容的。
子域名枚举是为一个或多个域名查找子域名的过程,它是安全评估和渗透测试前期侦查和信息收集的重要手段。
/* * 功能:这个直接对数据库操作的工具类 * 作者:施爷 * 时间:2017-3-17 * */ package com.shi.util; import java.io.*; import java.sql.*; import java.util.ArrayList; import java.util.Properties; //这个包不要导错了 不然会出现pp.load();没这个放法 public class SQLHellp { //定义需要的变量 private Co
CT技术伴随着一定剂量的辐射,会对患者的身体健康造成影响,而且 高剂量的辐射会损害人体的遗传物质,甚至造成不可逆的损伤,进而诱发癌症。 因此,如何在保证成像质量的前提下尽可能地降低 CT 辐射剂量一直是科学家们 研究的热点目标之一。此外,传统的CT扫描技术只能显示患者体内病灶的形态, 无法显示目标结构的化学成分信息。由于不同化学组分的生物组织经过 X 射线扫描后可能会具有相近甚至相同的衰减系数,从而导致成像不准确进而造成误诊。
但是我看到了一个比较狡猾的数据集(GSE133283),它官网给出来了的文件如下所示:
这几天研究的跟PyTorch没啥关系,跟深度学习也没啥关系,但是跟做项目关系很大,那就是怎么把CT影像可视化。 要完美复现代码,需要安装的扩展包simpleITK,ipyvolume,diskcache,cassandra-driver
这样的例子,就是作者不提供cellranger 的三个结果文件,matrix.mtx,barcodes.tsv 和 genes.tsv,不过大部分其它数据集,比如 GSE128033 和 GSE135893,你随便下载其中一个,就能看到每个样本都是走流程拿到10x单细胞转录组数据的3个文件的表达矩阵。
命令运行监测 监测命令的运行时间 time command ct@ehbio:~$ time sleep 5 real 0m5.003s # 程序开始至结束的时间,包括其它进程占用的时间片和IO时间 user 0m0.001s # 进程真正执行占用CPU的时间, sys 0m0.002s # 进程在内核中调用所消耗的CPU时间 user+sys是进程实际的CPU时间。如果多线程执行,这个时间可能大于Real。如果IO是瓶颈,则real会大于user+sys (单线程)。 查看正
值得注意的是,有一些包其实是在GitHub上面哦,如果你网络比较差,需要自己想办法解决,如果连包读无法安装,不妨试试看我们的**马拉松授课(直播一个月互动教学) ,可以看完我们从2000多个提问互动交流里面精选的200个问答!2021第二期_生信入门班_微信群答疑整理,以及 2021第二期_数据挖掘班_微信群答疑笔记
今天将分享CT图像肺结节自动诊断分析完整实现版本,为了方便大家学习理解整个流程,将整个流程步骤进行了整理,并给出详细的步骤结果。感兴趣的朋友赶紧动手试一试吧。
领取专属 10元无门槛券
手把手带您无忧上云