昨天我们介绍了一下关于excel函数的基础。包括如何调用函数以及在函数使用过程当中需要注意的引用问题。今天我们就来介绍几个常用的excel函数。今天就来介绍一下: IF函数以及countif函数
关于excel函数都有固定的输入形式,我们只需要按照固定的位置输入想要的东西即可。
IF(条件判断,如果符合这个条件则为,如果不为这个条件则为)
对于IF函数而言,我们在处理数据用的最多的当时进行数据类型转换的时候,即把连续性的数据转换为分类变量。
假如我们有一组临床患者的数据。中间是一个年龄分组。对于年龄而言我们的数据是一个类似连续性的数据。但是我们在进行分析时候,有时候需要把他转换为二分类的数据。比如按照年龄 = 60分组,如果是低于60则都标记为2,如果高于或等于60则标记为2。这个时候我们就可以使用IF函数。
这个时候我们就只需要在后面的一列输入=IF(B2 < 60, 2,1)即可。在这个公式里面,B2 < 60代表判断B2这个位置的数字是不是比60小,如果是则为2,如果不是则为1。
需要注意的时候,我们在函数当中输入数字的时候,可以直接输入,如果是要输入文本需要加英文状态下的双引号。例如还是上面的例子,我们在得到1和2之后,想把1和2分别变成高于60和低于60。那就可以这么写 =IF(C2 = 1, "高于60", "低于60")
以上我们演示的其实是两个只是一个简单的把连续性的数据变成二分类的结果。如果是要变成三分类或者多分类怎么办呢?这个时候就可以使用IF函数的嵌套即可。
例如还是?年龄的例子,如果我们想要50-60的单独的标记出来。如果大于60则为1,如果< 50则为3,50-60的标记为2。那么就可以这么写 =IF(B2 > 60, 1, IF(B2 >= 50, 2, 3))
以上的嵌套式我们在进行多条件的嵌套的。同样的我们也可以进行多个不同函数的嵌套。例如我们在生存分析的时候,需要把数据按照中位值进行分组。如果我们大于中位值的时候就标记为2,如果小于中位值则标记为1。这个时候,如果要进行条件判断的时候,我们就需要计算这列数据的中位值,在excel我们可以直接使用MEDIAN来计算中位值的。所以我们就可以直接写成=IF(B1 > MEDIAN(B:B),1,2)即可。
COUNTIF(需要进行判断的范围,某一个标准)
我们在处理数据的时候,有时候对于分类变量需要来进行计数,来统计一下每个变量都有多少个。这个时候就可以用到countif函数。这个函数可以对某一个范围的内容基于某一个标准来进行判断。最后来统计出符合这个标准的所有的总数。
例如上面的例子当中,最后我们把年龄分成了两组(大于60和小于60)。
这个时候我们想要看大于60的人有多少(即标记为1的个数)。这个时候就可以输入=COUNTIF(C:C, 1)。这个函数当中C:C代表我们在C整列来进行检索所有等于1的单元格。
对于这个函数,需要注意的是,这个函数适用于分类变量的统计。对于连续性的变量,想要筛选比如说<60的个数。则不能使用countif。另外如果想要多标准的筛选,则可以使用countifs。这个我们就不在这里介绍了。