首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

Python数据分析-数据探索下

主题 数据探索

接着上一节的内容~

二、数据特征分析

5. 相关性分析

(1)直接描述散点图

从散点图可以比较直观地看书两个变量的相关性。(一般分为完全正线性相关、完全负线性相关、非线性相关、正线性相关、负线性相关、不相关)

(2)绘制散点图矩阵

可对多个变量同时进行相关关系的考察

(3)计算相关系数

这里的相关系数有很多,如Pearson相关系数、spearman相关系数、判定系数等等

三、python主要数据探索函数

python中用于数据探索的库主要是pandas和matplotlib,而pandas提供大量的函数,也作为重点来进行介绍

1. 基本统计特征函数(均属pandas)

(1)sum(),计算数据样本的总和(按列计算)

(2)mean(),计算算数平均数

(3)var(),计算方差

(4)std(),计算标准差

(5)corr(),计算Pearson相关系数

(6)cov(),计算协方差矩阵

(7)skew(),计算偏度

(8)kurt(),计算峰度

(9)describe(),给出样本的基本描述

2. 统计作图函数

(1)plot(),绘制线性二维图,matplotlib/pandas

使用格式:plt.plot(x,y,S)

字符串S指定绘制图形的类型、样式和颜色,常用的有:‘b’为蓝色、‘r’为红色、‘g’为绿色、‘o’为圆圈、‘+’为加号标记、‘-’为实线、‘--’为虚线

(2)pie(),绘制饼形图,matplotlib/pandas

(3)hist(),绘制二维条形直方图,matplotlib/pandas

(4)boxplot(),绘制样本数据的箱形图,pandas

(5)plot(logy=true),绘制y轴的对数图形,pandas

(6)plot(yerr=error),绘制误差条形图,pandas

—End—

”欢迎关注,嘻嘻~”

  • 发表于:
  • 原文链接http://kuaibao.qq.com/s/20171215G0138300?refer=cp_1026
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券