首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

啤酒尿布的故事

这是一个很老但很有意思的故事 我们去沃尔玛超市会发现一个很有趣的现象:货架上啤酒尿布竟然放在一起售卖,这看似两者毫不相关的东西,为什么会放在一起售卖呢?...原来,在美国,妇女们经常会嘱咐她们的丈夫下班以后给孩子买一点尿布回来,而丈夫在买完尿布后,大都会顺手买回一瓶自己爱喝的啤酒(由此看出美国人爱喝酒)。...于是就毫不犹豫地将尿布啤酒摆放在一起售卖,通过它们的关联性,互相促进销售。“啤酒尿布”的故事一度是营销界的神话。 那么问题来了,商家是如何发现啤酒尿布两者之间的关联性呢?...比如啤酒尿布。 回到啤酒尿布的故事,在这里我们假设支持度阈值为50%,可信度阈值为70%。...那么它就表示:同时购买尿布啤酒的顾客占全部顾客的50%;在购买尿布的顾客中,有70%的顾客同时会买啤酒。 因此,在商品摆放时。应该将啤酒尿布放在一起。 晚安,各位。

72150

啤酒尿布到关联规则

啤酒尿布的故事 传说二十世纪90年代,美国沃尔玛超市的销售管理人员在分析销售订单时发现,啤酒尿布这两件看起来毫不关联的商品竟然经常会出现在同一个订单中。...后来跟踪调查发现,原来美国的年轻夫妇一般在周五晚上妻子会安排丈夫去超市购买尿布,而丈夫在购买尿布时总会忍不住顺便给自己买上几罐啤酒,这就是为什么啤酒尿布这两件看起来毫不关联的商品经常会出现在同一个购物篮中...Apriori算法--发现频繁项集的一种方法 原理:如果一个项集是频繁项集,则它的所有非空子集都是频繁项集; 如果一个集合不是频繁项集,则它的所有父集都不是频繁项集。...Apriori算法实现过程如下: ?...这里需要注意的是,X->YY->X的置信度不一定相等。 ?

1.2K20
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    关联推荐:啤酒怎么爱上尿布

    即关联组合出现的频率,比如‘尿布’在五个订单出现的频率=4/5;‘尿布->啤酒’ 在五个订单出现的频率=3/5; 3,什么是置信度?...关联组合的条件概率,比如尿布->啤酒的置信度是:在尿布出现的条件下,啤酒出现的概率 = 3/4 ,也等于 ‘尿布->啤酒’的支持度 / ‘尿布’的支持度。 4,什么是提升度?...比如‘尿布->啤酒’的置信度 / ‘啤酒’ 的支持度 = 提升度。 一个有效的简单关联规则应具有较高的置信度和较高的支持度。...5,怎么找到效果好的频繁项集 — Apriori 算法 有兴趣同学,可以考虑一些对等类为核心的Eclat算法 5.1,需要将数据转成事务对象。...,啤酒,可乐」,「啤酒尿布」。

    45020

    购物篮分析:绝不只是“啤酒尿布”!

    你肯定听说过著名的“啤酒尿布”吧——“购物篮分析”正是得名于一个相关的经典实例:超市对顾客的购买记录数据库进行关联规则挖掘,可以发现顾客的购买习惯,例如,购买产品X的同时也购买产品Y,于是,超市就可以调整货架的布局...最后不妨再八卦两句“啤酒尿布”的故事吧:一见到这几个字,我们马上就能脑补出一个骄傲的年轻父亲走进商场给孩子买尿布的场景。...孩子出生前,他习惯周五晚上哥们儿一起出去喝酒,现在可没机会了,但他还是惦记着过去的好时光,看见尿布边上的啤酒,忍不住买上一打回家畅饮,聊作安慰。...这个案例炒得轰轰烈烈,然而我至今似乎也没见过真的把啤酒尿布摆在同一货架上的超市。...总之,啤酒尿布与其说是个案例,不如说是个寓言童话。 然而,我们为何要在此提起这个已经屡遭夸大利用的故事呢?它当然不是毫无意义的。

    1.7K60

    大数据案例:啤酒尿布的关联算法怎么来的?

    故事背景: 在一家超市中,通过大数据分析发现了一个特别有趣的现象:尿布啤酒这两种风马牛不相及的商品的销售数据曲线竟然初期的相似,于是就将尿布啤酒摆在一起。...如果 我们要描述关于尿布啤酒的关联规则(买尿布的人也会买啤酒),那么我们可以这样表示:买尿布→买啤酒。 ?...和关联算法很相关的另一个概念是置信度(Confidence),也就是在数据集中已经出现A时,B发生的概率,置信度的计算公式是:AB同时出现的概率/A出现的概率。...就“啤酒+尿布”这个案例而言,使用关联规则挖掘技术,对交易资料库中的记录进行资料挖掘,首先必须要设定最小支持度最小可信度两个门槛值,在此假设最小 支持度min-support=5%且最小可信度min-confidence...其 中,Support(尿布啤酒)≥5%于此应用范例中的意义为:在所有的交易记录资料中,至少有5%的交易呈现尿布啤酒这两项商品被同时购买的交易行 为。

    1.4K80

    数据挖掘相关联系著名案例——啤酒尿布

    前言 “啤酒尿布”的故事是营销届的神话,“啤酒”和“尿布”两个看上去没有关系的商品摆放在一起进行销售、并获得了很好的销售收益,这种现象就是卖场中商品之间的关联性,研究“啤酒尿布”关联的方法就是购物篮分析...缘起   “啤酒尿布”的故事可以说是营销界的经典段子,在打开Google搜索一下,你会发现很多人都在津津乐道于“啤酒尿布”,可以说100个人就有100个版本的 “啤酒尿布”的故事。...沃尔玛从上个世纪90年代尝试将A prior算法引入到POS机数据分析中,并获得了成功,于是产生了“啤酒尿布”的故事。 ?...比如啤酒尿布同时出现在购物篮中的概率是20%,我们称啤酒尿布的支 持度是20%,按照国际命名规则表示为:啤酒Implies 尿布=20%。   ...“啤酒尿布”不等于“尿布啤酒”——相关性的单向性:这不是一句绕口令,这是代表商品之间的相关性具有单向性。我们前面讲过,“啤酒尿布”代表了一种因果关系。

    8.9K60

    啤酒尿布是传奇典范, 还是纯粹以讹传讹?

    无论是书籍、杂志、媒体报导甚至是厂商文宣,只要能跟商业智能、数据分析或数据挖据稍微扯上关系或想搭上热潮的,都一定要跟经典案例中的经典-啤酒尿布致敬一下。...沃尔玛内部人员自行分析了多年来的事务数据,发现在周末晚上啤酒尿布常常被一起购买,因此改变了商品陈列的方式,将这两项商品放在一起。结果是,啤酒尿布的销售量大增。...透过数据库查询分析,发现20多种的商品有特殊关联性,其中一项就是每天下午5点至7点,许多顾客的购物篮内都买了啤酒尿布。...(其实咳嗽糖浆跟果汁也是其中一项发现,只是没这么好用来掰故事,所以鲜为人知) 那么,Osco Drug的人有因此把尿布陈列到啤酒旁吗?没有!有把咳嗽糖浆堆到果汁隔壁吗?没有!...比较追根究底的人们,从现实生活中就能判断出这一传奇的真假:不管是沃尔玛的美式或本地卖场,商品陈列依旧是按照类型摆放,如啤酒跟红酒烈酒放在酒精饮料区,尿布跟卫生纸或婴儿用品放在同一区,即使网络商店也不曾见过买尿布加价送啤酒等促销活动

    45520

    啤酒尿布放在一起卖得更好?来看看这个故事背后的Apriori算法

    Apriori算法号称是十大数据挖掘算法之一,在大数据时代威风无两,哪怕是没有听说过这个算法的人,对于那个著名的啤酒尿布的故事也耳熟能详。...我们来简单回顾一下这个故事,据说在美国的沃尔玛超市当中,啤酒尿布经常被摆放在同一个货架当中。...如果你仔细观察就会觉得很奇怪,啤酒尿布无论是从应用场景还是商品本身的属性来分都不应该被放在一起,为什么超市要这么摆放呢?...用啤酒尿布的故事举个例子,比如很多人经常一起购买啤酒尿布,那么啤酒尿布就经常出现在人们的购物单当中。...所以啤酒尿布就属于同一个频繁项集,而一个人买了啤酒很有可能还会购买尿布啤酒尿布之间就存在一个关联规则。表示它们之间存在很强的内在联系。 有了频繁项集和关联规则我们会做什么事情?

    1.2K20

    手把手教你挖掘数据:怎样创造一个“尿布啤酒”的都市传奇?

    在频繁项集挖掘中令人满意的有趣规则的典范是一再被传颂的都市传奇——“尿布啤酒”。 ? 1. 都市传奇“尿布啤酒” 我记得第一次听到这个故事是在1998年的一个数据挖掘研究生课程上。...令他们高兴的是,商店的数据挖掘团队发现,周四下午5点~7点,男人们频繁地购买尿布啤酒。该商店将一个小的尿布陈列柜移到啤酒通道中,结果两种产品的销售量同时飙升。...链接: http://www.theregister.co.uk/ 2006/08/15/beer_diapers 如果你相信这两篇文章讲述的细节,尿布啤酒的故事则是说明早期数据挖掘可能性的一个示例:...零售商利用发现的知识,在周四这天提高啤酒的价格。 购买啤酒的动机是作为照顾孩子的报酬(购买尿布想必是为了孩子)。 零售商对这些模式特别感兴趣,因为尿布是有利可图的商品。...本文摘编自《Python数据挖掘:概念、方法实践》,经出版方授权发布。

    57420

    Thinking in SQL系列之数据挖掘Apriori关联分析再现啤酒尿布神话

    Mail:10867910@qq.com 说起数据挖掘机器学习,印象中很早就听说过关于啤酒尿布的神话,这个问题经常出现在数据仓库相关的文章中,由此可见啤酒尿布问题对数据挖掘领域影响的深远程度。...先看看它的成因: “啤酒尿布”的故事产生于20世纪90年代的美国沃尔玛超市中,沃尔玛的超市管理人员分析销售数据时发现了一个令人难于理解的现象:在某些特定的情况下,“啤酒尿布”两件看上去毫无关系的商品会经常出现在同一个购物篮中...啤酒尿布问题归属于关联分析,即从一组数据集中发现项之间的隐藏关系,是一种典型的无监督学习。关联规则的项集可以是同构的如啤酒->尿布,也可以是异构的如夏天->空调备货。...构建关联规则,根据最小置信度剪枝输出结果,为了保持通用性,使用参数集PARAMS(支持度2,置信度60%)来驱动全盘,Thinking in SQL,一气呵成,如下: 执行后看看机器学习的成果,故事结局变成了啤酒尿布纸巾的那些事...,再看看迅雷不及掩耳的0.25秒(个人电脑工龄11年): 啤酒尿布这类经典算法能够让我们拓展思维,并非局限于纵向拓展(术业专攻,自认能力有限),否则会陷入“太学术”的误区死角。

    1.5K80

    营销 | 不止是啤酒尿布,Taste Analytics用大数据带电商玩转口碑营销

    在快消行业,啤酒尿布成了大数据应用的经典案例: 全球零售业巨头沃尔玛通过对消费者购物行为进行分析时发现,男性顾客在购买婴儿尿片时,常常会顺便搭配几瓶啤酒来犒劳自己,于是沃尔玛将啤酒尿布陈列在一起,大大提升了两种商品的销量...可见,品牌商户依赖大数据分析进行决策,借助可视化的呈现界面,不仅将顾客忠诚度量化,帮助营销者们更加直观地了解每个品牌营销的消费者基础和特点,还能查看关键词云图呈现的信息,是否市场推广信息所契合,从而与消费者产生共鸣...在电商时代,对顾客反馈信息进行有效的利用分析,品牌营销者们才能建立准确、有效的营销手段。据悉,高乐氏采用的Taste Analytics非结构数据分析平台Signals现在已进入中国市场

    88820

    如何使用 SQL 对数据进行分析?

    同时,在进行算法调参、优化的时候也存在灵活度差的情况。因此最直接的方式,还是将 SQL 数据分析模块分开,采用 SQL 读取数据,然后通过 Python 来进行数据分析的处理。...我们来看下数据理解一下,下面是所有的订单,以及每笔订单购买的商品: 订单编号 购买的商品 1 beer(啤酒)、diapers(尿布)、chips(薯条) 2 beer(啤酒)、diapers(尿布)...3 beer(啤酒)、diapers(尿布) 4 beer(啤酒)、chips(薯条) 5 beer(啤酒) 6 beer(啤酒)、diapers(尿布)、chips(薯条) 7 beer(啤酒)、diapers...同时,我们还需要理解一个概念叫做“置信度”,它表示的是当你购买了商品 A,会有多大的概率购买商品 B,在这个例子中,置信度(啤酒尿布)=5/7=0.71,代表如果你购买了啤酒,会有 71% 的概率会购买尿布...薯条), diapers(尿布)}等; 其中关联规则有 7 种,包括了购买 chips(薯条) 的人也会购买 beer(啤酒),购买 diapers(尿布)的同时也会 beer(啤酒) 等。

    2.5K10

    机器学习(八)—Apriori算法

    摘要:本文对Apriori算法进行了简单介绍,并通过Python进行实现,进而结合UCI数据库中的肋形蘑菇数据集对算法进行验证。   ...“啤酒尿布”的例子相信很多人都听说过吧,故事是这样的:在一家超市中,人们发现了一个特别有趣的现象,尿布啤酒这两种风马牛不相及的商品居然摆在一起。但这一奇怪的举措居然使尿布啤酒的销量大幅增加了。...可以结合某家店的交易清单来说明这两个概念: 交易号码 商品 0 豆奶,草莓 1 草莓,尿布啤酒,辣椒酱 2 豆奶,尿布,黄瓜,饼干 3 黄瓜,饼干,尿布啤酒 4 黄瓜,啤酒尿布,黄瓜 频繁项集指的就是那些经常一起出现的物品集合...,比如{啤酒尿布,饼干}就是频繁项集中的一个例子,而根据上表也可以找到尿布->啤酒这样的关联规则。   ...一个项集的支持度指的是数据集中包含该项集记录所占的比例,上例中{豆奶}的支持度是2/5,{啤酒尿布}的支持度是3/5;可信度是针对于像{尿布}->{啤酒}这样的关联规则来定义的,定义为:支持度({尿布

    75720

    如何使用 SQL 对数据进行分析?

    同时,在进行算法调参、优化的时候也存在灵活度差的情况。因此最直接的方式,还是将 SQL 数据分析模块分开,采用 SQL 读取数据,然后通过 Python 来进行数据分析的处理。...我们来看下数据理解一下,下面是所有的订单,以及每笔订单购买的商品: 订单编号 购买的商品 1 beer(啤酒)、diapers(尿布)、chips(薯条) 2 beer(啤酒)、diapers(尿布)...3 beer(啤酒)、diapers(尿布) 4 beer(啤酒)、chips(薯条) 5 beer(啤酒) 6 beer(啤酒)、diapers(尿布)、chips(薯条) 7 beer(啤酒)、diapers...同时,我们还需要理解一个概念叫做“置信度”,它表示的是当你购买了商品 A,会有多大的概率购买商品 B,在这个例子中,置信度(啤酒尿布)=5/7=0.71,代表如果你购买了啤酒,会有 71% 的概率会购买尿布...薯条), diapers(尿布)}等; 其中关联规则有 7 种,包括了购买 chips(薯条) 的人也会购买 beer(啤酒),购买 diapers(尿布)的同时也会 beer(啤酒) 等。

    1.8K30

    【数据挖掘】关联规则挖掘 Apriori 算法 ( Apriori 算法过程 | Apriori 算法示例 )

    文章目录 一、 Apriori 算法过程 二、 Apriori 算法示例 参考博客 : 【数据挖掘】关联规则挖掘 Apriori 算法 ( 关联规则简介 | 数据集 事物 Transaction 概念...数据挖掘】关联规则挖掘 Apriori 算法 ( 关联规则性质 | 非频繁项集超集性质 | 频繁项集子集性质 | 项集超集支持度性质 ) 一、 Apriori 算法过程 ---- 原始数据集 \rm...奶粉 , 莴苣 002 莴苣 , 尿布 , 啤酒 , 甜菜 003 奶粉 , 尿布 , 啤酒 , 橙汁 004 奶粉 , 莴苣 , 尿布 , 啤酒 005 奶粉 , 莴苣 , 尿布 , 橙汁 最小支持度阈值为...0.6 2 项集 \{ 奶粉 , 啤酒 \} 支持度 0.4 2 项集中只有 \{ 奶粉 , 尿布 \} , \{ 尿布 , 啤酒 \} , \{ 莴苣 , 尿布 \} ,...尿布 , 啤酒 \} 支持度 0.4 3 项集中没有频繁项集 ;

    1.3K00

    数据挖掘系列(2)--关联规则FpGrowth算法

    上一篇数据挖掘系列(1)关联规则挖掘基本概念Aprior算法介绍了关联规则挖掘的一些基本概念和经典的Apriori算法,Aprori算法利用频繁集的两个特性,过滤了很多无关的集合,效率提高不少,但是我们发现...我们还是以上一篇中用的数据集为例: TID Items T1 {牛奶,面包} T2 {面包,尿布,啤酒,鸡蛋} T3 {牛奶,尿布,啤酒,可乐} T4 {面包,牛奶,尿布,啤酒} T5 {面包,牛奶,...1)此处即从{啤酒}开始,根据{啤酒}的线索链找到所有{啤酒}结点,然后找出每个{啤酒}结点的分支:{牛奶,面包,尿布啤酒:1},{牛奶,尿布啤酒:1},{面包,尿布啤酒:1},其中的“1”表示出现...啤酒}},即{啤酒}的频繁集一定有相同的后缀{啤酒},此处的条件频繁集为:{{},{尿布}},于是{啤酒}的频繁集为{{啤酒}{尿布啤酒}}。...},这组频繁项集一定包含一个相同的后缀:{尿布},并且不包含{啤酒},因此这一组频繁项集上一组不会重复。

    1.2K90

    机器学习算法一览

    关联分析:挖掘啤酒尿布(频繁项集)的关联规则 20世纪90年代美国沃尔玛超市中,超市管理人员分析销售数据时发现 “啤酒尿布”两件看上去毫无关系的商品会经常出现在同一个购物篮中。...在美国有婴儿的家庭中,一般是母亲在家中照看婴儿,年轻的父亲去超市买尿布时,往往会顺便为自己购买啤酒。如果在卖场只能买到两件商品之一,他很有可能会放弃购物而去另一家可以同时买到啤酒尿布的商店。...“啤酒+尿布”故事中利用的就是关联算法,比较常见的一种关联算法是FP-growth算法算法中几个相关的概念: 频繁项集:在数据库中大量频繁出现的数据集合。...置信度:有关联规则如{'尿布'} -> {'啤酒'},它的置信度为 {'尿布'} -> {'啤酒'} 假设{'尿布', '啤酒'}的支持度为 0.45,{'尿布'}的支持度为 0.5,则{'尿布'...如同啤酒尿布的例子,超市如果将啤酒尿布放在相邻的位置,会增加两者的销量。 用于发现共现词。在浏览器中输入"普元"时,浏览器自动弹出如"普元平台","普元EOS"等备选记录。

    65421

    数据挖掘系列(1)关联规则挖掘基本概念Aprior算法

    啤酒尿布的故事已经成为了关联规则挖掘的经典案例,还有人专门出了一本书《啤酒尿布》,虽然说这个故事是哈弗商学院杜撰出来的,但确实能很好的解释关联规则挖掘的原理。...举个例子,在上面的表中,我们发现购买啤酒就一定会购买尿布,{啤酒}-->{尿布}就是一条关联规则。...例如:support({啤酒}-->{尿布}) = 啤酒尿布同时出现的次数/数据记录数 = 3/5=60%。   ...例如:confidence({啤酒}-->{尿布}) = 啤酒尿布同时出现的次数/啤酒出现的次数=3/3=100%;confidence({尿布}-->{啤酒}) = 啤酒尿布同时出现的次数/尿布出现的次数...仔细想一下,我们会发现对于{啤酒-->尿布},{尿布-->啤酒}这两个规则的支持度实际上只需要计算{尿布啤酒}的支持度,即它们交集的支持度。

    1.4K60

    拥抱人工智能,从机器学习开始

    关联分析:挖掘啤酒尿布(频繁项集)的关联规则 20世纪90年代美国沃尔玛超市中,超市管理人员分析销售数据时发现 “啤酒尿布”两件看上去毫无关系的商品会经常出现在同一个购物篮中。...在美国有婴儿的家庭中,一般是母亲在家中照看婴儿,年轻的父亲去超市买尿布时,往往会顺便为自己购买啤酒。如果在卖场只能买到两件商品之一,他很有可能会放弃购物而去另一家可以同时买到啤酒尿布的商店。...由此,沃尔玛发现了这一独特的现象,开始在卖场尝试将啤酒尿布摆放在相同区域,让年轻的父亲可以同时找到这两件商品,从而获得了很好的商品销售收入。...置信度:有关联规则如{'尿布'} -> {'啤酒'},它的置信度为 {'尿布'} -> {'啤酒'} 假设{'尿布', '啤酒'}的支持度为 0.45,{'尿布'}的支持度为 0.5,则{'尿布'...如同啤酒尿布的例子,超市如果将啤酒尿布放在相邻的位置,会增加两者的销量。 用于发现共现词。在浏览器中输入"普元"时,浏览器自动弹出如"普元平台","普元EOS"等备选记录。

    52830
    领券