首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

用户问答:如何看懂数据?

猴子数据分析训练营的第2关视频课程是《如何看懂数据?》,根据同学在训练营里的讨论,我对常见问题进行了整理和回答。 【问】什么是字段? 字段信息就是表的列名(比如Excel表的列名)。...Python也有专门的计算四分位数的工具,方法如下: 【问】在分析就餐人员距离案例中,在箱线图中是如何看出大部分数据集中在哪一端的?...这个案例中的箱线图,中位数距离下四分位数比较近,表明大部分数据集中盒子的下端,也就是大部分数据集中在下四分位数和中位数之间。...快速记住的方法:在箱线图中,中位数离哪个四分位数(上四分位数、下四分位数)近,数据就集中在哪一端。 【问】发现下面的箱线图的箱子被压的很扁,这是为什么?...【问】在课程里下面这个表中,为什么说美国股市的波动大小(夏普比率公式中的分母)几乎是回报的2倍? 夏普比率=(投资回报-无风险回报)/投资组合的标准差。

71830

通过空气质量指数AQI学习统计分析并进行预测(上)

从图中可以看出,已经填充完成,现在没有缺失值了。接着我们再来看下有没有异常值。 4.2 异常值 4.2.1 异常值探索 发现异常值: ?...左侧的子图是严重的右偏分布,在取对数后基本上趋于正态分布。 ? 4.2.2.2 使用边界值替换 我们可以对异常值进行截断处理,即使用临界值替换异常值。例如,在3σ与箱线图中,就可以这样来处理。...以上柱形图中的两条线指的是什么?指的是置信区间,默认为95%的置信度,总体均值在95%的概率下是不会超过线(置信区间)的。...在柱形图中,仅显示了内陆城市和沿海城市空气质量指数(AQI)的均值对比,我们可以使用箱线图来显示更多的信息。 sns.boxplot(x="Coastal",y="AQI",data=data) ?...结果:有99%的几率可以认为沿海城市的空气质量普遍好于内陆城市。 ? 两独立样本T检验补充笔记: ? 使用边界值替换与分箱离散化在AQI分析与预测下部分会详细讲解。

2.5K82
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    浅谈n个球和m个盒子之间的乱伦关系

    无视标题,从我做起 球异,盒同 不空 该情况为经典的第二类斯特灵数 设$f[n][m]$表示答案。...$ 相当于是考虑$m$个盒子的顺序 球同,盒异 不空 插板法的经典例题 $n$个球之间形成$n - 1$个空位,把$m$个盒子塞到里面 方案为$C_{n - 1}^{m - 1}$ 可空 注意这里不能直接套用...C_{n+m-1}^{m - 1}$ 这里再补充一下为什么不能直接套用插板法 比如$n = 2, m = 3$时,方案为$6$,而直接套用插板法得到的答案为$3$。...究其原因,是因为没有考虑到两个板同时占了一个空位的情况。...球同,盒同 可空 这种情况下,不同方案之间与具体用了哪个球以及放到了哪个盒子里都没有必然的联系 区分不同方案的方法是:把每个盒子的球的个数从小到大排序,比较最终的情况是否相同 例如:$1  7  1$与

    1.8K30

    一篇文章教你如何用R进行数据挖掘

    注:这篇文章对于之前没有很多数据科学知识的同学们是特别值得一看的,同时掌握一定的代数和统计知识将会更有益于您的学习。 目录 一、 初识R语言 1、 我为什么要学R?...事实上,我没有编程经验,也没有学过计算机。但是我知道如果要学习数据科学,一个人必须学习R或Python作为开始学习的工具。...R console:这个区域显示的输出代码运行:,同时你可以在控制台直接写代码。但是代码直接进入R控制台无法追踪。 R环境:这个空间是显示设置的外部元素补充道。...在图中,,黑色的点就是一个异常值,盒子里黑色的线是每个项目类型的平均值。 3、缺失值处理 缺失值对于自变量和因变量之间的关系有很大的影响。现在,让我们理解一下缺失值的处理的知识。...从左上的第一个残差拟合图中我们可以看出实际值与预测值之间残差不是恒定的,这说明该模型中存在着异方差。解决异方差性的一个常见的做法就是对响应变量取对数(减少误差)。 ? ?

    4.1K50

    前端成神之路-CSS高级技巧

    元素的显示与隐藏 目的 让一个元素在页面中消失或者显示出来 场景 类似网站广告,当我们点击关闭就不见了,但是我们重新刷新页面,会重新出现!...1.4 显示与隐藏总结 属性 区别 用途 display 隐藏对象,不保留位置 配合后面js做特效,比如下拉菜单,原先没有,鼠标经过,显示下拉菜单, 应用极为广泛 visibility 隐藏对象,保留位置...通常我们使用于强制一行显示内容 white-space:normal ;默认处理方式 white-space:nowrap ; 强制在同一行内显示所有文本,直到文本结束或者遭遇br标签对象才换行。...5.2 精灵技术讲解 CSS 精灵其实是将网页中的一些背景图像整合到一张大图中(精灵图),然而,各个网页元素通常只需要精灵图中不同位置的某个小图,要想精确定位到精灵图中的某个小图。 ?...给盒子指定小背景图片时, 背景定位基本都是 负值。 5.4 制作精灵图(了解) CSS 精灵其实是将网页中的一些背景图像整合到一张大图中(精灵图),那我们要做的,就是把小图拼合成一张大图。

    6.8K30

    CSS——06扩展:高级

    元素的显示与隐藏 目的 让一个元素在页面中消失或者显示出来 场景 类似网站广告,当我们点击关闭就不见了,但是我们重新刷新页面,会重新出现!...1.4 显示与隐藏总结 属性 区别 用途 display 隐藏对象,不保留位置 配合后面js做特效,比如下拉菜单,原先没有,鼠标经过,显示下拉菜单, 应用极为广泛 visibility 隐藏对象,保留位置...通常我们使用于强制一行显示内容 white-space:normal ;默认处理方式 white-space:nowrap ; 强制在同一行内显示所有文本,直到文本结束或者遭遇br标签对象才换行。...为什么需要使用精灵图技术: 为了有效地减少服务器接受和发送请求的次数,提高页面的加载速度。...5.2 精灵技术讲解 CSS 精灵其实是将网页中的一些背景图像整合到一张大图中(精灵图),然而,各个网页元素通常只需要精灵图中不同位置的某个小图,要想精确定位到精灵图中的某个小图。

    4.7K40

    【CSS3】css开篇基础(4)

    2.标准流 标准流(Normal Flow)是网页布局的默认排版模式,指的是元素在没有使用浮动、定位等特殊布局属性时,按照默认的排列顺序进行排列的机制。... 标准流的盒子 浮动的元素会一行内显示并且元素顶部对齐 如果多个盒子都设置了浮动,则它们会按照属性值一行内显示并且顶端对齐排列...转换 浮动的盒子中间是没有缝隙的,是紧挨着一起的 浮动带来的问题 后续标准流元素的正常布局 一个元素浮动了,理论上其余的兄弟元素也要浮动。...注意浮动的盒子只会影响浮动盒子后面的标准流,不会影响前面的标准流. 也就是说标准流如果在浮动盒子前面,那么浮动盒子不会影响标准流,会在其下部。而在后面会发生重叠,可能影响到结果。...绝对定位 绝对定位不会保留原来的位置(脱离文档流),那后面盒子就会往上占了它的位置; 如果没有祖先元素或者祖先元素没有定位,则以浏览器为基准定位; 如果祖先元素有定位(可以是相对、绝对或者固定定位

    6710

    jQuery做轮播图

    这是我自己做的一个简单的轮播图,效果图如下: 我觉得轮播图中最主要的是要理解到图片为什么会滑动,是怎么控制的。上面这个我自己做的,是搭好的一个结构,在无序列表中插入需要的图片。...然后在插入图片的后面添加一个空的无序列表,作为轮播图中下方的小点。...从从上至下排列变为水平方向排列,也就是给li添加一个float属性;然后有一点需要注意,轮播图外面的大盒子必须设置为图片的大小,超出的隐藏,这样可以刚刚好显示出一张图片。...然后装图片的ul的宽度必须大于或者等于所有图片总宽度。同样,这里也需要运用一个定位的知识,子绝父相。给class为box的盒子设置相对定位,装图片的ul设置绝对定位。...这里,尽管轮播图下面几个点没有,但是我们要把样式先写好,然后后面通过JavaScript添加。

    1.4K20

    斯坦福大学密码学-分组密码 03

    8.PNG 一个糟糕的S-box。 设想一些S盒子仅是将6位输入以不同的方式进行异或,然后输出4位。S盒子是线性的。 9.PNG 线性S盒子是不安全的。...如果S盒子是线性的,那么DES所做的无非是计算异或和置换各位,因此所有的DES只是一个线性函数。 这样的DES是不安全的。...将三个明文 的输出结果异或,可以得到在点 异或点 异或点 处的DES加密结果。这不应该是一个随机函数应该满足的关系,一个随机函数无法满足这个等式。...14.PNG DES的加强。 方法1:Triple-DES 15.PNG 为什么不用 2-DES? meet-in-middle 攻击。...再替换下一层,所以都是不可区分的。 image.png 如何计算?0往左走,1往右走。 image.png GGM PRF。没有广泛使用的原因是速度很慢。

    1.9K40

    巧用box-shadow实现布局区域间隔变色

    巧用box-shadow实现布局区域间隔变色 前言 之前给客户做了一个网站,整体是1200px宽.因此,网页整体是放在一个 1200px的盒子里的.但是今天,客户突然要求实现这样的变色效果,一个区域是灰色的...如果兼顾头尾,则必然还是要修改html结构,必须在所有需要变色的板块外面加上一个100%宽的盒子 好了,综合分析,背景图片貌似不能完美解决我的问题.没关系,我CSS很强大.猛然间我想到了一个牛逼的CSS....但是,所有的盒子都有了这个平铺的灰色背景.我们需要实现的是间隔变色,而不是全部变成灰色的背景....思考 这个不是100%的平铺的,而是宽度是有限的.这样,在足够高的分辨率下面,可能会产生问题哦....但是,以我的例子来说,1200*3 = 3600 这样的宽度,足够胜任目前99.999%的显示器了.剩下部分用4K的土豪,我相信也不会在这样高分辨率的显示器上全屏看网页.所以,这样写是没有问题的呀!!

    61310

    2016年WEB前端学习误区详解之WEB前端学习路线

    首先分享一下我的经验,想做好一件事,必须要花费一些功夫,然后是多学、多思、多练、多交流、多总结,发现自己的问题,然后一定要克服,在状态不好的情况下,往往要及时调整。...新手学习前端的话,一定要想想为什么要学习它,是出于一种什么心态,然后定位好自己,多向大牛请教,多教一些没有自己水平高的人,那样往往能让自己成长的快,切勿急躁。...在“设计”视图中看效果,在“代码”视图中学本质, 将各种视图的优势发挥到极致,这种对照学习的方法弥补了单纯识记HTML标签和属性的枯燥乏味,想必对各位初学的小盆友们来说必定是极好的!   ...在CSS布局时需要注意的一个问题是很多同学缺乏对页面布局进行整体分析,不能够从宏观上对页面中盒子间的嵌套关系进行把握,就急于动手去做,导致页面中各元素间的关系很混乱,容易出现盒子在浮动时错位等情况。...建议大家在布局时采用“自顶向下,逐步细化”的思想,先用几个盒子将页面从整体上划分,然后逐步在盒子中继续嵌套盒子。

    61230

    谈谈一些有趣的CSS题目(六)-- 全兼容的多列均匀布局问题

    6、全兼容的多列均匀布局问题 如何实现下列这种多列均匀布局(图中直线为了展示容器宽度,不算在内): ?...Demo戳我 没有得到意料之中的结果,并没有实现所谓的两端对齐,查找原因,在 W3C 找到这样一段解释: 最后一个水平对齐属性是 justify,它会带来自己的一些问题。...再寻找原因,原来是出在最后一个元素上面,然后我找到了 text-align-last 这个属性,text-align-last属性规定如何对齐文本的最后一行,并且 text-align-last 属性只有在...Demo戳我 结束了?没有,查看一下 text-align-last 的兼容性: ?...Demo戳我,任意列数均匀布局 此方法初见于这篇文章,得到原博主同意写入了本系列,非常值得一看: 别想多了,只不过是两端对齐而已 所有题目汇总在我的 Github ,发到博客希望得到更多的交流。

    91350

    【看动漫学编程】程序员在异世界生个娃 第3篇:搞不好我就是个王者

    小说剧情为剧情需要,过渡到知识点,部分篇幅可能没有技术知识点还望谅解。 由于没有经费支持,所以画出来的东西是我自己用代码慢慢画的,质量不好效果也不好,还望见谅。...目录 【看动漫学编程】程序员在异世界生个娃 第一篇:太极村 【看动漫学编程】程序员在异世界生个娃 第二篇:外挂已准备就绪 02-0篇:零奕的心理优越 零奕已经入学一周,现在的零奕可是整个学院的名人,上到院长下到走兽都被零奕唠叨过...“能够在5岁使用交流术法那么就正式进入码人阶段,交流术法也叫做本能术法,此后所学习的所有术法都必须要使用魂气显现出字符串。我们幻化出来的术法字符串,需要进行排列,我们叫做编程。我给你们演示一下。”...“零奕的办法是可以解决,但是太过麻烦。其实我们可以在灵魂中设置一个变量盒子,变量盒子可以存储一个内容,并且这个内容可以计算和改变。这个变量盒子每次用的时候加上1,这样就可以了。”...该来的还是要来的,由于刚刚小叶老师注意力在后排学生,并没有看见零奕自己一个人显现术法。小叶老师忐忑的看着零奕…深呼一口气。 “零奕你来。” “12”。(此处有彩蛋,为什么零奕会停顿一下呢?)

    40820

    数据科学统计学:什么是偏度?

    所以,即使你没有读过数据科学或分析专业人士的偏度,你肯定已经在非正式上与这个概念进行了互动。...现在,你可能会想,为什么我在这里谈论正态分布? 正态分布是没有任何偏度的概率分布。你可以看看下面的图片,它显示了对称分布,基本上是正态分布,你可以看到虚线两边是对称的。...正如我前面提到的,理想的正态分布是几乎没有偏度的概率分布。它几乎完全对称。因此,正态分布的偏度值为零。 「但是,为什么它几乎完全对称而不是绝对对称?」...这是因为,事实上,没有一个真实的数据完全符合正态分布。因此,偏度的值不完全为零;它几乎为零。虽然零值被用作确定分布的偏度度的参考。 你可以在上图中看到,同一条线表示平均值、中值和众数。...你还可以在上图中看到「均值<中值<众数」。 ? 在箱线图中,负偏度四分位数之间的关系由以下公式给出: ? 与我们之前所做的类似,如果Q3-Q2和Q2-Q1相等,那么我们寻找线的长度。

    1.6K10

    web前端开发学习路线:html+css+JavaScript的学习方法

    在“设计”视图中看效果,在“代码”视图中学本质, 将各种视图的优势发挥到极致,这种对照学习的方法弥补了单纯识记HTML标签和属性的枯燥乏味,想必对各位初学的小盆友们来说,必定是极好的!...Web前端的学习建议 最后给大家聊聊在学习Web前端中的一些建议和方法: 在CSS布局时需要注意的一个问题是很多同学缺乏对页面布局进行整体分析,不能够从宏观上对页面中盒子间的嵌套关系进行把握,就急于动手去做...,导致页面中各元素间的关系很混乱,容易出现盒子在浮动时错位等情况。...建议大家在布局时采用“自顶向下,逐步细化”的思想,先用几个盒子将页面从整体上划分,然后逐步在盒子中继续嵌套盒子。...“君子生非异也,善假于物也”,在学习的过程中还要多浏览一些优秀的网站,善于分析借鉴其设计思路和布局方法,见多方能识广,进而才可以融会贯通,取他人之长为我所用。

    99800

    利用jQuery手动实现一个轮播图

    这是我自己做的一个简单的轮播图,效果图如下: 我觉得轮播图中最主要的是要理解到图片为什么会滑动,是怎么控制的。上面这个我自己做的,是搭好的一个结构,在无序列表中插入需要的图片。...然后在插入图片的后面添加一个空的无序列表,作为轮播图中下方的小点。...从从上至下排列变为水平方向排列,也就是给li添加一个float属性;然后有一点需要注意,轮播图外面的大盒子必须设置为图片的大小,超出的隐藏,这样可以刚刚好显示出一张图片。...然后在轮播图中,想让图片动起来并且从视觉上看没什么异样,我们首先需要克隆第一张图片,并且将第一张图片加在最后。...在定义一个size值,令其等于轮播图中图片的数量。然后让装所有图片的容器往左移动图片的宽度*i,这样在定时器的配合之下,图片就会一张一张的一次展示。

    2.2K50

    四种检测异常值的常用技术简述

    在某些情况下,异常值可以提供有关整个系统中局部异常的信息;因此,检测异常值是一个有价值的过程,因为在这个工程中,可以提供有关数据集的附加信息。...为了展示所选择的离群值检测技术是如何工作的,将专注于找出机场平均到达延误的异常值,这些异常值是在给定机场降落的所有航班上计算的。我们正在寻找那些显示不寻常的平均到达延迟时间的机场。...计算第一和第三四分位数(Q1、Q3),异常值是位于四分位数范围之外的数据点x i: ? 使用四分位数乘数值k=1.5,范围限制是典型的上下晶须的盒子图。...; 4.使用四种选定的技术检测异常值; 5.使用KNIME与Open Street Maps的集成,在MapViz元节点中显示美国地图中的异常值机场。...蓝色圆圈表示没有异常行为的机场,而红色方块表示具有异常行为的机场。平均到达延迟时间定义的大小了记。

    1.5K20

    R数据科学|5.3内容介绍

    你可以使用binwidth参数来设定直方图中的间隔的宽度,该参数是用x轴变量的单位来度量的。 技巧: 在使用直方图时,你可以试试不同的分箱宽度,因为不同的分箱宽度可以揭示不同的模式。...在同一张图上叠加多个直方图,可以使用geom_freploy(),它使用折线来显示计数,叠加的折线比叠加的条形更容易理解: ggplot(data = smaller, mapping = aes(x...5.3.2 典型值 在实际数据分析应用下,以下几点我们应该铭记在心: 哪些值是最常见的?为什么? 拿些值是非常罕见的?为什么?这和你的预期相符吗? 你能发现任何异乎寻常的模式吗?如何解释?...5.3.3 异常值 定义: 异常值是与众不同的观测或者是模式之外的数据点。 出现的可能原因: 数据录入错误;如果数据量比较大,有时很难在直方图上发现异常值。...如果两次分析的结果差别不大,那么可以用缺失值替代异常值,然后继续进行分析。但如果两次分析的结果有显著差别,那么你就不能在没有正当理由的情况下丢弃它们。

    89920
    领券