首页
学习
活动
专区
圈层
工具
发布

综合实例

本文主要记录在学习机器学习过程中做的一些简单的小项目,项目代码均来自于杨志晓老师的《Python机器学习一本通》一书,机缘巧合之下这本书也算是我接触Python机器学习的启蒙书籍,书本很厚,但是其实内容不多...数据表的描述性统计为:\n', df_iris[['f0', 'f1', 'f2', 'f3','species']].describe()) #%% print('iris数据表category...print('iris数据表按species分组后前5组每组的数量为:\n', irisGroup.count().head()) #%% print('iris数据表按species分组后前...().head()) #%% print('iris数据表按species分组后前5组每组的和为:\n', irisGroup.sum().head()) #%% print('iris数据表按...#获取组名 print('iris数据表按species分组聚合后的组名为:\n',irisPivot.index) #获取组的数量 print('iris数据表按species分组聚合后的组的数量为

3.2K20
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    生信学习小组Day6笔记—Chocolate Ice

    安装与加载R包镜像设置目的:加快加载速度方法:应用R的配置文件:Rprofile说起来这个,就必须提到Rstudio最重要的两个配置文件:在刚开始运行Rstudio的时候,程序会查看许多配置内容,其中一个就是...”):安装Biocductor的包加载R包library(包)或者require(包)Rstudio中包只需要安装一次,但每次启动都需要重新加载R包dplyr包的五个基础函数以R自带的iris数据框为例...-----来自https://zhuanlan.zhihu.com/p/443548010x %>% f() %>% g() #等同于g(f(x))test %>% group_by(Species...( test1, test2, by = 'x') #不在乎test1与test2是否匹配半连接:返回能够与y表匹配的x表所有记录semi_joinsemi_join(x = test1, y = test2..., by = 'x')反连接:返回无法与y表匹配的x表的所记录anti_joinanti_join(x = test2, y = test1, by = 'x')简单合并bind_rows()函数需要两个表格列数相同

    1.1K30

    机器学习笔记——哑变量处理

    这种哑变量的编码过程在R和Python中的有成熟的方案,而无需我们手动进行编码,使用成熟的编码方案可以提升特征处理的过程。 R语言哑变量处理: data(iris) ?...这里仍以iris数据集为例,假设这里的Species变量是要进入模型的其中一个自变量,在建模前需要对齐进行哑变量处理。...方法二——model.matrix函数: R语言内置包stat中有一个model.matrix函数(无需单独加载既可用),它可以处理分类变量的哑变量处理过程,语法非常简单。...Python中的哑变量处理工具: from sklearn.preprocessing import Imputer,LabelEncoder,OneHotEncoder from sklearn...回顾一下今天分享的哑变量处理知识点: R语言: 方案一——:dummy包的dummy函数 方法二——:model.matrix函数 方法三——:caret包中的dummyVars函数 Python:

    3.4K30

    Day6 呦呦鹿鸣—学习R包

    内容源自生信星球学习小组安装和加载R包1.镜像设置(设置国内镜像网站能加快R包的下载)options("repos" = c(CRAN="https://mirrors.tuna.tsinghua.edu.cn...dplyr示例数据test iris[c(1:2,51:52,101:102),]取R自带的iris数据第1,2,51,52,101,103行?...(2)按列名筛选select(test, Petal.Length, Petal.Width)iris %>% select(Species, Sepal.Length)3.filter()筛选行/返回具有匹配条件的行可以按照某分类变量的值进行数据筛选...(Sepal.Length), sd(Sepal.Length))R中的管道操作符2:count统计某列的unique值count(test,Species)分类变量每个变量值的频数dplyr处理关系数据将...,每列数值的类型必须相同;以"by"的列为标准,补齐列表,空值为"NA"4.半连接:返回能够与y表匹配的x表所有记录semi_join交集表中test1部分的列semi_join(x = test1,

    1K10

    Jelys Note之生信入门class6

    常用的可视化R包:画图:base【随软件自动下载】、ggplot2(*很重要)、ggpubr(低配版ggplot2)拼图:Par里的mfrow、grid.arrange、cowplot、customLayout...(1)Plot()多种图形plot(iris[,1],iris[,3],col = iris[,5]) 做一个横坐标用iris第一列的数据,纵坐标用第三列的数据,颜色用第五列数据的图> text(6.5,4...双分面facet_grid(Group ~ Species)Dat = irisdat$Group = sample(letters[1:5],150,replace = T)原表中没有的列名,用$可代表新增一列...导出为ppt,全部元素都是可编辑模式library(eoffice)topptx(p,"iris_box_ggpubr.pptx")五、拼图R包patchwork当代码可运行却不出图--因为画板被占用...:c("red ","grey"," darkgreen ")图片【R语言里面的足够使用的颜色R包】Library(paletteer)Library(Rcolorbrewer)2.箱线图【有离群值,点是属于箱线图

    1.1K00

    (数据科学学习手札51)用pymysql来操控MySQL数据库

    一、简介   pymysql是Python中专门用来操控MySQL数据库的模块,通过pymysql,可以编写简短的脚本来方便快捷地操控MySQL数据库,本文就将针对pymysql的基本功能进行介绍; 二...: '''获取操作游标''' cur = db.cursor()   接下来我们使用.execute()来执行需要完成的SQL语句,其传入参数为字符串类型的SQL语句,譬如,下面的例子中我们创建一个新的表...,以创建iris表''' cur.execute("CREATE TABLE IF NOT EXISTS iris" "(Sepal_Length float,"...navicat中查看iris表中的全部数据: USE test; SELECT * FROM iris;   这是会发现,查询结果只有一张空表,这是因为在执行完插入数据的语句后,并没有提交结果,使用....,COUNT(*) FROM iris GROUP BY Species") '''获取查询结果''' results = cur.fetchall() print(results)   可以看到

    64940

    MySQL基础入门——MySQL与R语言、Python交互

    MySQL作为z最为流行的关系型数据库管理平台之一,与绝大多数数据分析工具或者编程语言都有接口,今天这一篇分享如何将MySQL与R语言、Python进行连接。...R语言中与SQL管理平台通讯的接口包有很多,可以根据自己使用的数据库平台类型以及习惯,挑选合适的接口包。因为我个人笔记本使用的MySQL平台,所以本篇仅以MySQL为例分享。...mydata", #指定导入后的表名 value = iris, #指定要导入的R内存空间数据对象 row.names = FALSE #忽略行名...: Python与MySQL连接: from sklearn.datasets import load_iris import pandas as pd from sqlalchemy import...以上仅仅是MySQL与R语言、Python交互的基础函数,当然还有更为复杂的增删以及插入命令,如果需要了解详细内容可以参考RMySQL、sqlalchemy库的官方文档。

    1.6K80

    ​python单细胞学习笔记-day4(续)

    前面,我们生信技能树的讲师小洁老师与萌老师新开了一个学习班:《掌握Python,解锁单细胞数据的无限可能》,身为技能树的一员,近水楼台先得月,学起!...下面是我的学习笔记,希望可以给你带来一点参考 前面几天的学习笔记: python单细胞学习笔记-day1 python单细胞学习笔记-day2 python单细胞学习笔记-day3 python单细胞学习笔记...', data=iris) plt.show() 2、箱线图 sns.boxplot(x='species', y='sepal_length',data=iris, palette='Set2...(x='species', y='sepal_length',data=iris, palette='Set2',hue='species',width=0.3, legend=False) # 点图...ax是axes的缩写 这个图类似的在 R语言里面也有:《R绘图系统 第二版》 plt.subplots(1,2,figsize = (10,5)):一行两列 fig, (ax1, ax2) = plt.subplots

    34210
    领券