首页
学习
活动
专区
圈层
工具
发布

【R语言】R中的因子(factor)

R中的因子用于存储不同类别的数据,可以用来对数据进行分组,例如人的性别有男和女两个类别,根据年龄可以将人分为未成年人和成年人,考试成绩可以分为优,良,中,差。...R 语言创建因子使用 factor() 函数,向量作为输入参数。...levels:指定各水平值, 不指定时由x的不同值来求得。 labels:水平的标签, 不指定时用各水平值的对应字符串。 exclude:排除的字符。 ordered:逻辑值,用于指定水平是否有序。...这个顺序也是有讲究的,一般是按字母顺序来排列。我们也可以按照自己的需要来排列因子的顺序。...关于这个参数后面我们还会给大家举个更实际的,跟临床数据相关的例子。 R中的因子使用还是更广泛的,例如做差异表达分析的时候我们可以根据因子将数据分成两组。

4.2K30
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    「R」R 中的方差分析ANOVA

    因此回归分析章节中提到的lm()函数也能分析ANOVA模型。不过,在这个章节中,我们基本使用aov()函数。最后,会提供了个lm()函数的例子。...R默认类型I(序贯型)方法计算ANOVA效应(类型II和III分别为分层和边界型,详见R实战(第2版)202页)。...R中的ANOVA表的结果将评价: A对y的影响 控制A时,B对y的影响 控制A和B的主效应时,A与B的交互影响。 一般来说,越基础性的效应需要放在表达式前面。...单因素方差分析 单因素方法分析中,你感兴趣的是比较分类因子定义的两个或多个组别中的因变量均值。...glht.png par语句增大了顶部边界面积,cld()函数中的level选项设置了使用的显著水平。 有相同的字母的组说明均值差异不显著。

    5.4K21

    R tips: R中的颜色配置方案

    数据可视化不可避免的就是要选择一些颜色方案,颜色方案除了手动设置之外,在R中也有自动生成颜色方案的工具。...R中的HCL配色方案 HCL本意是和RGB HSV等一样的颜色空间的术语,由于这里所用的颜色方案在R中是hcl.pals函数,所以就称为HCL配色方案了。...HCL相比较HSV等颜色空间的一个重要优点就是颜色的视觉明度是均一的,在R中也是推荐使用hcl颜色方案,不推荐使用rainbow等颜色方案了。...,常用于着色离散变量; sequential的颜色方案中色调较少,体现了颜色的连续过渡,可以用于着色连续变量; diverging和divergingx也是颜色的连续过渡,但是不同于sequential...") # [1] "#1B9E77" "#D95F02" "#7570B3" 不同于hcl的配色方案,RColorBrewer中颜色方案数量是固定的,不会对颜色进行自动插值,比如Dark2配色一共只有

    4.3K40

    R中的sweep函数

    函数的用途 base包中的sweep函数是处理统计量的工具,一般可以结合apply()函数来使用。...当我们我们需要将apply()统计出来的统计量代回原数据集去做相应操作的时候就可以用到sweep()。...函数的参数 sweep(x, MARGIN, STATS, FUN = "-", check.margin = TRUE, ...) x:即要处理的原数据集 MARGIN:对行或列,或者数列的其他维度进行操作...,与apply的用法一样 STATS:需要对原数据集操作用到的统计量 FUN:操作需要用到的四则运算,默认为减法"-",当然也可以修改成"+","*","/",即加、乘、除 check.margin:是否需要检查维度是否适宜的问题...…… 下面我们结合几个具体的例子来看 #创建一个4行3列的矩阵 M = matrix( 1:12, ncol=3) 1.每一行都减去这一行的均值 #方法一,通过rowMeans函数来计算每一行的均值

    3.7K20

    微软推出iPad应用Earth Lens,使用AI来检测卫星图像中的物体

    微软Garage的最新项目之一,利用AI来确定卫星图像中需要注意的精确项目。Earth Lens是今天推出的一款新的开源iPad应用程序,识别,跟踪和分析距离地面数英里的照片中的物体。...微软Garage项目经理Lainie Huston在一篇博客文章中写道:“从图像数据中提取洞察力是一个昂贵的过程,可能需要数天时间才能推迟决策过程中的关键任务。...你通常需要一个专门的团队来梳理成千上万的卫星图像。” 为了加快这一点,参加微软车库实习计划的温哥华实习生建立了一个应用程序,可以借助卫星数据和计算机视觉,协助救灾和环境保护。...用户只需轻点几下即可打开和关闭对象类,或者在时间序列模式下查看卫星图像,该模式可以绘制数据可视化图表中的变化,模式和趋势图表。...另一个最近的实验Swips Insights,也是开源提供的,利用算法从Windows 10 PC上的屏幕截图中提取信息。例如,定制西装的屏幕截图可能会提供有关其购买地点的信息。

    56830

    「R」R检验中的“数据是恆量”问题

    之前我学习和自己分析时就遇到过,尝试使用判断的方式事先检查它是不是数据存在问题(这类数据明显不服从正态分布),可以使用正态性检验,或者直接判断是不是样本组内的数据是完全一样的,如果一样就不要这个了。...所遇到的问题: 分析两个样本之间是否存在差异,每个样本三个重复。现在用的是t.test,但有些样本三个重复的值一样(比如有0,0,0或者2,2,2之类的),想问下像这种数据应该用什么检验方法呢?...以下是我的回答: 数据是恒量是无法做t检验的,因为计算公式分母为0(不懂的看下统计量t的计算公式,一般标准差/标准误为分母,所以恒量是不能算的)。...,如果一样,则输出原始的结果,再筛选其中差异大的基因 。...9508518/why-are-these-numbers-not-equal https://stackoverflow.com/questions/23093095/t-test-failed-in-r

    5.5K10

    R中的线性回归分析

    回归分析(regression analysis) 回归分析是研究自变量与因变量之间关系形式的分析方法,它主要是通过建立因变量Y与影响它的自变量Xi(i=1,2,3...)之间的回归模型,来预测因变量Y...的发展趋势。...简单线性回归模型 Y=a+b*X+e Y——因变量 X——自变量 a——常数项,是回归直线在纵轴上的截距 b——回归系数,是回归直线的斜率 e——随机误差,即随机因素对因变量所产生的影响...回归分析函数 lm(formula) formula:回归表达式y~x+1 lm类型的回归结果,一般使用summary函数进行查看 预测函数 predic(lmModel,predictData...,level=置信度) 参数说明: lmModel:回归分析得到的模型 predictData:需要预测的值 level:置信度 返回值:预测结果 data <- read.table('data.csv

    1.9K100

    Kaggle冠军告诉你,如何从卫星图像分割及识别比赛中胜出?

    王小新 编译自 Kaggle 量子位 出品 | 公众号 QbitAI 在2016年12月至2017年3月期间,Kaggle网站举办了一场对英国国防科学与技术实验室(DSTL)提供的卫星图像进行场景特征检测的图像分割比赛...主办方所提供的训练集里包含了25个1平方公里大小地区的高分辨率卫星图像,具体任务是通过算法进行识别10个不同类型的对象,分别是: 房屋和楼房; 混杂的人工建筑; 道路; 铁路; 树木; 农作物; 河流;...△ Kyle的Kaggle主页 比赛结束后,冠军Kyle Lee接受了Kaggle网站的采访,详细地介绍了他在这次比赛中的获胜之道。...我注意到,无论是在训练数据中,还是根据常识来判断,车辆往往停放在道路上或道路附近,以及建筑物的周围。 ?...所以在最终解决方案中,我没有使用预先训练好的模型。 你是如何度过这次比赛?

    3K90

    爬当当各分类下的五星图书

    这次作业选择爬取的网站是当当网,一方面是因为传说比较简单,另一方面也有比较多的图书数据,特别是五星图书,包含了各个领域最受欢迎的图书信息,对于寻找有价值的图书、分析好书的一些情况具有一定的价值。...t=http://bang.dangdang.com/books/fivestars/01.00.00.00.00.00-all-0-0-1-1 具体的页面如下图: 当当五星图书页面 我想爬取的数据是各分类...但最后在完整的代码中,还是把headers加上了,保险起见吧。 既然这样,其他的链接也可以通过这样的方式来获取,于是比较了一下多个类目的xpath,很容易发现规律。...获取所有的类目链接如下: 爬回来的部分的链接 接下来就是分别爬取每个分类下的图书信息,以“小说”为例,其实翻页特别简单,给几个比较如下: 翻页也非常简单,只不过有一点点坑的是,爬回来的链接在代码中,...对返回来的链接进行分析,发现仅仅是中间有四个数字不一样。于是我把这几个数据取出来,在连接中传进去,这样可以构造通用的链接。

    1.1K70
    领券