apple开源机器学习框架turicreate中的SFrame,是一种新形态的dataframe,作为之前热爱过R语言的dataframe的玩家来看,还不够简洁,不过有自己独特的功能。
apple开源机器学习框架turicreate中的SFrame,是一种新形态的dataframe,作为之前热爱过R语言的dataframe的玩家来看,还不够简洁,不过有自己独特的功能。
github:https://apple.github.io/turicreate/docs/api/generated/turicreate.SFrame.html
导入模块的方式:
一、数据读入与导出
支持csv/txt/json
1.1 导入与导出csv——read_csv
主函数
读入举例:
导出举例:
1.2 json格式数据的读入导出
其中!cat 有查看功能。
1.3 自由格式保存
有点像R里面的workspace的保存,一股脑保存出去,然后再读进来。
.
二、SFrame基本操作2.1 生成SFrame框
借助SArray来生成:
下面也有从dict格式导入、还有从pd.dataframe两种格式导入。
2.2 列操作2.2.1 选中列
通过[‘name’]选中。
这个跟pd.DataFrame一样
通过一个函数来选择:
2.2.2 列举列名
2.2.3 新增列 .add_column()
2.3 行操作2.3.1 选中行
切片一样,但是sf[1]代表选中第二行,返回的是dict格式!奇特!
2.3.2 新增行
等同于pd.concat
2.4 逻辑选中行列 + 复合选中
如何选中’id’列的第三行内容,可以通过这样的方式选中。
(sf.ix[2,1]的方式不可用)
2.5 新增index
SFrame本身不会生成Index,跟pd的不一样。需要额外生成上去。
2.6 缺失值处理2.6.1 缺失值直接去掉
有以下几种模式:
2.6.2 缺失值填补
2.7 数据排序
数据排序有以下几种:
2.8 数据合并
等同于pd.merge
2.9 数据去重
.
三、SFrame数据运行3.1 使用apply并行
3.2 分组汇总sf.groupby
3.3 数据dataframe框内拆解
3.4 格式转换
领取专属 10元无门槛券
私享最新 技术干货