鹿明
生物
蛋白、代谢组学服务专家
关注我们收获更多
关注
数据分析在今天是一项非常重要的技能,它一般指找出数据背后隐藏的规律,可以运用在商业决策和投资决策、研究分析等多个领域。比如一个研究需要做数据挖掘,数据模型化的方法就有分类、估计、聚类、关联、预测等方式。如果对于蛋白组学和代谢组学来说如何选择分析模型?如何快速简便实现模型建立?最实用的工具不得不说是Excel。
而 Excel作为数据挖掘的重要工具,功能非常强大,包括简单线性回归分析、关联分析、聚类分析、判别分析、神经网络分析、决策树分析等。这些概念听起来比较抽象,其实一点都不难,下面小鹿从基础操作说起,以具体操让数据挖掘更高效快捷~~
一、
快速求和
普通操作
行和列分别输入 SUM 函数,然后向下/向右拖?
进阶操作:
选中要求和的区域(额外多选一列&一行),按下“ALT”+“=”。
二、
快速设置单元格格式
普通操作
选中一栏,单击鼠标右键-【设置单元格格式】,或者点击【开始】选项卡,然后在【数字】一栏中点击不同的选项。
进阶操作
键盘上数字键那一排,从【~到 5】的 6 个按键,配合【Ctrl+Shift】,快速实现设置单元格格式。
Ctrl+1 设置单元格格式对话框;
Ctrl+Shift+` 设置为常规格式;
Ctrl+Shift+1 设置为千分位数值格式;
Ctrl+Shift+2 设置为时间格式;
Ctrl+Shift+3 设置为日期格式;
Ctrl+Shift+4 设置为货币格式;
Ctrl+Shift+5 设置为百分比格式;
三、
选中大量连续单元格
普通操作
点住鼠标左键,然后一直拖一直拖。
进阶操作
向下连续选择:
选中要连续选择的第一行;
同时按下【Ctrl+Shift+】;
向右连续选择:
选中要连续选择的第一列;
同时按下【Ctrl+Shift+】;
四、
输入当前日期
普通操作
一个一个键地敲入,2020/03/15。搞不好输错了格式,Excel 不认为它是日期。
快捷操作
【Ctrl+;】:插入当前日期;
【Ctrl+Shift+;】:插入当前时间;
五、
快速填充
这是一大类操作,比如把手机中间几位变成星号、身份证号分段显示、一堆文字中提取数字等等。
普通操作
使用各种复杂的函数,又臭又长......
进阶操作
这就是新版本的优势啊!因为【快速填充】这个功能仅针对 Office 2013 及以上版本适用哦。想要对于处理一堆有规律的数据,【快速填充】的方法,只需要一个【Ctrl+E】。
手机号中间快速加星号、分段等:
批量合并、提取等:
以上只是个举例,对于快速填充的要诀就是,你先给他一个“葫芦”,然后他就会“画瓢”了!
注:以上的操作,前提是你的数据要足够有规律哦~
针对海量数据,数据挖掘在文献发展评价、文献信息库挖掘、模型分析、算法改进等都有非常大的应用价值。
比如我们想要从文献角度评估和挖掘医学中某领域的科研发展水平。首先我们要收录相关医学主题的文献,从时间分布、单位分布、地域分布、期刊分布、第一著者分布和主要内容等方面进行多角度文献分析,这些数据的处理如果用今天我们分享的方法能大大节省分析时效。甚至通过这些数据背后我们可以更深层分析出该领域的研究论文数据情况、相关科研单位在此领域中的重视程度、学科领域的推广程度等。
科研研究中数据挖掘的意义非常重大,初级版我们可以用Excel就能完成基础的分析,更强大的数据挖掘及分析欧易/鹿明生物易明学院将会不定期推出生信课程,请关注鹿明生物公众号哦~~
猜你还想看
END
黑大帅 撰文
领取专属 10元无门槛券
私享最新 技术干货