首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

数据分析中的常用“公式

虽然文章标题中含有“公式”,但本文侧重于——从公式的角度看数据分析的思维方式。...X->Y 此处用来表示自变量X和因变量Y的关系(严格来说,这个算不上一个公式),公众号的老朋友们应该会发现我在很多文章中都会参考这个公式的框架。...描述、解释、预测是数据分析常见的3种场景: 描述,可以理解为用指标来对业务进行展示的过程,比如报表开发、指标体系等,这个过程好比要用一个量化的指标来衡量Y(比如KPI),然后再分析组成Y需要有哪些成分X...加权求和 该公式表示整体和局部的关系,既可以用于对某个指标的拆解,也可以类似用AHP方法来合成一个新的综合指标。 e.g....连乘公式 通常用于带有“转化率”的场景,比如电商交易是典型的“鱼骨图”或者“漏斗”模式。 连乘公式可以用于业务环节的拆分,也可以和“加权求和”公式混合使用。 e.g.

79810
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    公式我都会,为何依然分析不好数据

    还在为时至今日依旧搞不懂大数据到底是什么而羞愧?还在为“统计学”这门看似烧脑的学科而望而却步不敢走进它的大门?...你要问:我实在对数字提不起兴趣,那是不是注定要被这个大数据时代抛弃? 为你重启兴趣之门:从现在开始不算晚 你说你不懂得如何激发兴趣? 比如你老跟我聊骰子点数出现的概率有啥意思?...没关系,它也许能深挖出你体内潜藏的求知欲;你感觉这个人被繁冗的理论公式掏空了都没欲望?没关系,他能帮你快速入门,深入浅出了解统计学各类理论知识,解锁操作技能。...这本书不会有繁冗的数学公式推导,不过在有些时候,为了说清楚问题,数学公式和定理是不可或缺的。水平有限,力争通过通俗易懂的语言让大家明白统计是怎么回事,以及统计可以用来做些什么。...喜欢编程并想深入研究理论知识的,可以使用Stata、SAS、R;想要快速解决问题的,可以使用SPSS;甚至可以使用Excel完成绝大多数统计分析工作。

    45330

    实用的典型相关分析(多公式预警)

    在sklearn的交叉分解模块中有两种典型算法族,一个是本文所述的典型相关分析算法(CCA),一个是偏最小二乘算法(PLS),他们都是具有发现两个多元数据集之间的线性关系的用途,本文先解释典型相关分析...常见的,比如考虑一组因变量和一组自变量的关系的量化,这个可以根据各自变量对应的真实数据进行概率学上的相关系数或协方差矩阵算出,如果说因变量有q个,自变量有p个,那就需要计算p*q次,这不仅计算次数多而且会因为忽略变量间强相关性而抓不到问题本质从而得出错误的结果...,所以自然而然会想到抽取同组变量的强相关性部分然后再求不同组的相关性,而抽取方法可以采用主成分的思想进行降维,这也是典型相关分析的思想所在(不过在具体抽取主成分有较大差异),典型相关分析本身是反映两组指标之间的整体相关性的一种多元统计分析方法...则计算此时向量 , 的方差,即有 可用把 看成常数,根据方差公式 ,类比到矩阵即可(tricks: 是向量,向量平方一定是自身与自身转置的乘积,然后再满足矩阵乘法维度变化即可),方差也可表示为自身与自身的协方差...和 不足以解释所有的原始变量,则需要在新找另一组变量 和 ,则此时转化为 后面两项为独立性的约束,很显然这里的思想是排除因为第一组强相关向量的干扰 因为这里是用协方差(这里也是相关系数,因为数据进行标准化后两者等同

    95320

    用ChatGPT编写Excel函数公式进行表格数据处理分析,so easy!

    在用Excel进行数据处理分析时,经常需要编写不同的公式,需要了解大量的函数。有了ChatGPT,就很简单了,直接用自然语言描述自己的需求,然后让ChatGPT写出公式就好了。...例子1: Excel某个单元格的内容是:https://content.blubrry.com/takeituneasy/lex_ai_jared_kushner.mp3 我想用一个公式来去掉“https...以下是具体的步骤: 假设你想要处理的单元格是A1,你可以首先使用 SUBSTITUTE 函数去掉"https://content.blubrry.com/takeituneasy/",这可以通过公式 =...然后你会得到一个如 "lex_ai_jared_kushner.mp3" 的结果,你可以再次使用 SUBSTITUTE 函数去掉 ".mp3",这可以通过公式 =SUBSTITUTE(B1, ".mp3.../takeituneasy/", ""), ".mp3", "") 这个公式首先会替换掉 "https://content.blubrry.com/takeituneasy/",然后再替换掉 ".mp3

    12410

    七种常见的数据分析法之:公式拆解法

    导读 公式拆解法是针对问题的层级式解析,在拆解之前,不能盲目拆解,需要有目的性的找方向,从而挖掘原因。 来源:诸葛io数据教练丨作者:诸葛io ?...看最上面这张图,以日销售额为例做了一次公式拆解分析,这次拆解一共包括了5层,最后一层是对推广效果的衡量。...公式拆解分析法的第一步是需要确定要分析的指标,然后找到这个指标的直接影响因素。...看到这,你明白什么是公式拆解法了么? 所谓公式拆解法就是针对某项指标,用公式表现该指标的影响因素,例如日销售额的影响因素是各商品的销售额,找到影响因素后,需要对影响因素的影响因素进行拆解。...公式拆解法是针对问题的层级式解析,在拆解之前,不能盲目拆解,需要有目的性的找方向,从而挖掘原因。

    1.9K10

    人工智能大数据背后的神秘公式:贝叶斯公式

    转自:工业智能化 大数据、人工智能、海难搜救、生物医学、邮件过滤,这些看起来彼此不相关的领域之间有什么联系?答案是,它们都会用到同一个数学公式——贝叶斯公式。...科学家把所有假设与已有知识、观测数据一起代入贝叶斯公式,就能得到明确的概率值。而要破译某种现象的成因网络,只需将公式本身也结成网络,即贝叶斯网络,它是贝叶斯公式和图论结合的产物。...接下来只需要向这个模型代入观测数据,通过网络节点间的贝叶斯公式重新计算出概率值。为每个新数据、每个连接重复这种计算,直到形成一个网络图,任意两个原因之间的连接都得到精确的概率值为止,就大功告成了。...贝叶斯公式的价值在于,当观测数据不充分时,它可以将专家意见和原始数据进行综合,以弥补测量中的不足。我们的认知缺陷越大,贝叶斯公式的价值就越大。...[5] 统计之都创作小组:失联搜救中的统计数据分析 [6]机器之心:《科学》封面重磅论文:人工智能终于能像人类一样学习

    3.2K50

    半正矢公式(Haversine公式

    如果我们需要批量求两个已知经纬度的点之间的距离, 就会用到半正矢公式,本文记录公式内容和推导过程。...简介 半正矢公式是一种根据两点的经度和纬度来确定大圆上两点之间距离的计算方法,在导航有着重要地位。...半正矢公式 对于任何球面上的两点,圆心角的半正矢值可以通过如下公式计算: \text{hav}\bigg(\frac{d}{r}\bigg)=\text{hav}(\varphi_2-\varphi...更准确的方法,应该是使用考虑地球离心率的 Vincenty 的公式或其他有关地理距离的论文所给出方法。 证明 1 已知A(φ1,λ1),B(φ2,λ2),地球半径R。...L_{AC}=2R\cos(φ_1)\sin((λ_2-λ_1)/2) 经过前面的一系列计算,已经得出了以下数据: L_{AC}=2R\cos(φ_1)\sin((λ_2-λ_1)/2) L_{BD}=

    88021

    精通数组公式16:基于条件提取数据

    excelperfect 在Excel中,基于AND或OR条件从数据集中提取数据是经常要做的事。...5.这里没有考虑使用VBA解决方案,有时使用它们是自动执行数据提取的好方法。 为何提取数据公式如此复杂? 当从表中提取数据时,实际上是在执行查找。...如下图1所示,提取满足3个条件的数据记录,可以看出有2条记录满足条件。对于垂直表,从多列中提取数据的查找公式不会很难;查找公式难于在多行中使用。...辅助列作为查找列,供查找函数查找并提取数据。 2.基于全数据集的数组公式。这些公式是独立的,不需要额外的列辅助。对于这些公式,必须在公式内为与条件相匹配的记录创建一个相对位置数组。 ?...图4:在单元格H12中输入的最终公式 当条件改变或者数据增加时,提取区域的数据会自动更新,如下图5所示。 ?

    4.3K20

    Excel公式技巧40: 对数据随机排序

    有时候,为公平起见,我们会将一组数据随机排序。如下图1所示,在列D中对列C中的数据随机排序。 ? 图1 实现过程如下: 步骤1:在列C的左侧添加两个辅助列,如上图1中的“序号”和“随机数”列。...步骤3:在列B中每个单元格中输入公式:=RAND(),生成随机数。如上图1所示,可以在单元格B3中输入公式后,下拉至单元格B11。...步骤4:在单元格D3中输入公式: =VLOOKUP(SMALL(B3:B11,A3),B3:C11,2,FALSE) 下拉至单元格B11。...这样,每次工作表重新计算时或者按F9键时,列D中的数据都会重新排列一次,如下图2所示。 ?...图2 上述列D的公式中,每一个单元格都在列B中查找对应的列A中相应位置的数字,然后返回相应的列C中的数据,由于RAND函数是易失的,因此每次工作表重新计算(输入数字、设置格式等)或者按F9键强制工作表重新计算时

    4.8K30

    Excel公式技巧18: 使用公式排序

    本文给出一个基于公式的排序解决方案,将指定区域内的数据按字母顺序排序。 如下图1所示,在单元格区域A2:A11中是一组未排序的数据,在单元格区域B2:B11中是已排序的数据。 ?...工作原理 让我们以单元格B8中的公式为例来分析: =LOOKUP(1,0/FREQUENCY(ROWS($1:7),COUNTIF($A$2:$A$11,"<="&$A$2:$A$11)),$A$2:$...A$11) 与单元格B2中的<em>公式</em>相比,唯一的变化是ROWS函数内由1改成了7。...<em>公式</em>中: COUNTIF($A$2:$A$11,"<="&$A$2:$A$11) 对于该区域内的每个字符串,返回一个值数组,对应该区域内按字母顺序位于该字符串之前或等于该字符串的字符串数。...($1:7),COUNTIF($A$2:$A$11,"<="&$A$2:$A$11)),0)) 小结 虽然可以使用Excel的排序功能,但使用<em>公式</em>可以实时更新<em>数据</em>。

    2K20

    Latex公式编辑和子公式编辑

    这里,“\label{XX}”为可选项,表示在文档中该公式标记为“XX”,在正文中通过“\eqref{XX}”来引用该公式编号(带括号)。...这里,\ref{YY}表示引用公式YY的编号(不含括号),\tag{\ref{YY}{a}}表示给该行公式打上标签,也可以写为\tag{2a},但是,这种条件下(2a)中的2不会随着YY公式编号的改变而改变...pss: align支持使用“&”使多行公式在指定位置对齐,公式的latex代码中不允许有空行;3、子公式编号格式二(编号为(1a)、(1b))首先可以使用“\tag{}”给各行公式任意编号,但是默认编号值不加一...在latex代码中标记为“ZZ”的公式,原本应该编号为(4),但是自动编号为(3)。...在上面的公式中,(3a)(3b)中的'a'、'b'是自动编号的。

    4.6K30

    最美公式

    欧拉公式暗示着:大自然充满无限想象,但是最终都会归于终点。 我们宇宙诞生于138亿年前的一次暴涨,那么138亿年前发生了什么事?...另外,虚数在物理学中还隐含了时间的属性,比如广义相对论的四维时空(闵可夫斯基时空)中时间就是虚数;而广义的欧拉公式e^ix=cosx+isinx,随着x的增长,该公式的数学图形是绕着原点旋转,定义域在[...简简单单的一个数学公式,也只使用了最基本的运算符号,不仅把数学中最基本的五个常数联系了起来,还包含了如此深奥的宇宙哲学原理,被称作“宇宙第一公式”一点不过分。   ...在数学中,你再也找不到能与之媲美的公式了,或许只有物理学中的质能方程还能一较高下;比如下图这个数学公式,虽然也包含了数学的基本常数,但是与欧拉公式相差甚远。...欧拉公式不仅仅是形式优美,而且还有着巨大的实用价值,比如在研究交流电时少不了它,信号分析时的必备数学工具,量子力学的重要数学工具,极坐标切换需要它,求反常积分需要它,研究任何圆周运动使用欧拉公式都能大大得到简化

    95220
    领券