首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

python︱apple开源机器学习框架turicreate中的SFrame——新形态pd.DataFrame

apple开源机器学习框架turicreate中的SFrame,是一种新形态的dataframe,作为之前热爱过R语言的dataframe的玩家来看,还不够简洁,不过有自己独特的功能。

apple开源机器学习框架turicreate中的SFrame,是一种新形态的dataframe,作为之前热爱过R语言的dataframe的玩家来看,还不够简洁,不过有自己独特的功能。

github:https://apple.github.io/turicreate/docs/api/generated/turicreate.SFrame.html

导入模块的方式:

一、数据读入与导出

支持csv/txt/json

1.1 导入与导出csv——read_csv

主函数

读入举例:

导出举例:

1.2 json格式数据的读入导出

其中!cat 有查看功能。

1.3 自由格式保存

有点像R里面的workspace的保存,一股脑保存出去,然后再读进来。

.

二、SFrame基本操作2.1 生成SFrame框

借助SArray来生成:

下面也有从dict格式导入、还有从pd.dataframe两种格式导入。

2.2 列操作2.2.1 选中列

通过[‘name’]选中。

这个跟pd.DataFrame一样

通过一个函数来选择:

2.2.2 列举列名

2.2.3 新增列 .add_column()

2.3 行操作2.3.1 选中行

切片一样,但是sf[1]代表选中第二行,返回的是dict格式!奇特!

2.3.2 新增行

等同于pd.concat

2.4 逻辑选中行列 + 复合选中

如何选中’id’列的第三行内容,可以通过这样的方式选中。

(sf.ix[2,1]的方式不可用)

2.5 新增index

SFrame本身不会生成Index,跟pd的不一样。需要额外生成上去。

2.6 缺失值处理2.6.1 缺失值直接去掉

有以下几种模式:

2.6.2 缺失值填补

2.7 数据排序

数据排序有以下几种:

2.8 数据合并

等同于pd.merge

2.9 数据去重

.

三、SFrame数据运行3.1 使用apply并行

3.2 分组汇总sf.groupby

3.3 数据dataframe框内拆解

3.4 格式转换

  • 发表于:
  • 原文链接http://kuaibao.qq.com/s/20171214G0WVX600?refer=cp_1026
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券