Loading [MathJax]/jax/output/CommonHTML/config.js
前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >PP-数据建模:明明删除了重复项,为什么还是说有重复值?

PP-数据建模:明明删除了重复项,为什么还是说有重复值?

作者头像
大海Power
发布于 2021-08-30 06:33:13
发布于 2021-08-30 06:33:13
3.8K0
举报

最近,有朋友在用Power Pivot构建表间关系的时候,出现了一个问题:明明我已经删除了重复项,但构建表间关系的时候,还是说我两个表都有重复的数据!结果表间关系建立不起来!

——按道理来说,Power Pivot出来也这么多年了,不至于会犯这么低级的错误!但是,我又绝对相信这些朋友既然能将问题提到这种程度,肯定也是做了删除重复项的操作。

于是,怀着好奇之心要来了数据,仔细查看对比后,终于发现了问题——这个情况真的很特殊,需要非常的注意!

我下面模拟一份数据来简单说明一下这种情况。如下图所示,以姓名列为基础进行删除重复项:

结果没有找到重复值:

为什么呢?表中的第2/3,4/5,6/7,8/9看起来不是一样的吗?

——实际上不是的,在3/5/7/9行的姓名中,后面都多了一个空格!所以,它们实际是不一样的,我们也可以做个数据透视表看看:

但是,如果我们把这些表放到Power Pivot中,然后构建表间关系,结果就出错了!

那到底是为什么呢?

我们先通过非重复计数函数来算一下,到底有没有重复的数据:

好嘛!表中明明有9行数据,非重复计数的结果却是5!说明其中必定有重复数据——即在Excel中不是重复的数据,但到了Power Pivot里出现重复了!

那么,其中到底哪些数据重复了?

我们通过Power Pivot里的数据透视功能看看:

结果如下图所示,真的很多都重复了,你看那些计数为2的!

但是,到底是谁跟谁重复了呢?我们挑其中一个双击出明细(比如数据透视表里最后1行的“小勤”),看看到底是哪2行:

显然,这是第2和第3行的数据。但我们在Excel里第2和第3行的姓名差别就在于:第3行中的姓名,后面多了一个空格!

至此,谜团终于揭开,并且,可以简单总结一下了:

1、如果相同的内容,一个后面没有空格,而另一个后面有空格,那么,在Excel里面,这是两项不一样的内容,也不能通过删除重复项清除(在Power Query里也同样不能);

2、但是,对于Power Pivot来说,无论后面是否有空格,在数据添加到数据模型时,文本后面的空格会被删除(我们可以从模型中将数据复制到Excel中查看),因此会被识别为重复项;

3、空格在前面的情况不会被处理,即相同的内容,如果一个前面有空格,而另一个没有,那么无论在Excel、Power Query还是Power Pivot中,都会被当做不同的项目。

啰啰嗦嗦写了这么鬼长,其实就一个核心知识点:文本后面的空格在Power Pivot中被忽略(删除)了!大家还可以尝试用更多的方法去验证它。

不过,这个找到问题原因的过程,希望对大家有点儿启发。

——感谢您的耐心阅读!

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2018-09-03,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 Excel到PowerBI 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
PP-数据建模:既然可以直接用,为什么还自己写度量公式?
大海:实际这个是Power Pivot自动生成的一个隐式度量值。你到数据模型里看看就知道了:
大海Power
2021/08/30
3800
Excel中的数据建模:表间关系一线牵,何须大量公式拼数据
大海:在传统数据透视表里的确是要那么干的,但到了Power Pivot里,当然就不用辣妈麻烦啦。直接拉根线连起来就把表的关系建好了,在数据分析的时候就可以直接用他们的关系了,数据根本不需要接进来。
大海Power
2021/08/30
2K0
pp-同样的数据做透视,“前10(n)项”筛选结果为毛不一样?
小勤:通过Power Pivot生成的数据透视表,里面的“前10项”筛选功能好像有点儿问题啊,你看这个数据:
大海Power
2021/08/30
8420
Power Pivot里的空文本怎么来的?怎么处理?日期也转换不了,怎么办?
假如说,这个文本里就只有空格(1个或多个),添加到Power Pivot数据模型时,空格会被删掉,问题是,删掉空格后的内容,到底是一个空值(blank)呢?还是一个空的文本("")?
大海Power
2021/08/30
9140
为啥用去重构造的单号表,建表间关系时仍然提示多对多,这明显是唯一值啊!|PBI实战
经检查发现,用values函数构建的这个发货单号表,中间存在空白内容,也就是说,原来的事实表里本身就存在空白(没有发货单号)的情况!
大海Power
2023/09/09
3590
为啥用去重构造的单号表,建表间关系时仍然提示多对多,这明显是唯一值啊!|PBI实战
PP-入门前奏:谁说透视表里的各行之和要等于总计的?
大海:这说明有某个客户是属于多个行(网点)里都存在,所以不重复的客户数总计会比各行之和少。
大海Power
2021/08/30
5350
你的DAX学习热情,是怎样一步步被磨掉的?
先说说这两天微信群里一个简单的案例,即根据下面的数据,统计每个人不含“质检”类型的非重复版本数量:
大海Power
2021/08/31
5790
Power Pivot数据建模基础:数据表间的4种基本关系类型
大海:在数据处理的时候,我们经常需要对2张相关的表格建立表间关系,比如订单表和订单明细表,订单明细表里的产品和产品表……那么2张表之间总是要能够找到明确的逻辑关系,才能建立表间关系,比如订单表里的订单编号和订单明细表里的订单编号是对应的。
大海Power
2021/08/30
3.7K0
理解DAX:为什么ALL(表)不去重,ALL(列)去重了?
小勤:ALL函数是清除所有筛选条件并返回表中的不重复值,下面对表的行进行计数应该是3呀,因为有两个大海是重复的,怎么还是4? 大海:没有说all返回的是不重复值啊。 小勤:那么我ALL(表[姓名]),
大海Power
2021/08/30
1.5K0
2.1 PowerBI数据建模-天下大模型必作于小的星型架构
加入 PowerBI自己学 知识星球 可以:下载源文件,边学边练;遇到问题,提问交流,有问必答。
PowerBI自己学_轻松
2025/02/24
1020
2.1 PowerBI数据建模-天下大模型必作于小的星型架构
用POWER BI 做人力资源数据建模是如此简单
人力资源的数据化转型需要HR在日常的工作中对人力资源各模块做落地的数据建模,数据分析是在数据可视化模型的基础上进行数据的交互,通过数据的交互和数据的交叉来进行数据分析,最终发现问题,解决问题。
王佩军
2022/09/28
1.3K0
Excel里没有非重复计数功能?用Power Query轻松解决!
小勤:大海,公司有个关于网点的客户数量统计问题,涉及到非重复计数的问题,这么常用的功能,Excel里居然不支持!
大海Power
2021/08/31
2.3K0
传统数据透视表之不能——非重复计数PowerPivot轻松解
大海:传统的数据透视表功能很强大,但非常奇怪的是——不支持非重复计数!你要用数据透视同时实现其他统计和非重复计数,又不想在原始数据表里增加辅助列的话,得考虑用Power Pivot了。
大海Power
2021/08/30
3.2K0
从工作表函数到DAX!
👆关注“博文视点Broadview”,获取更多书讯 作者:ExcelHome创始人周庆麟 来源:《DAX权威指南》推荐序 在ExcelHome技术论坛上,经常会有这样的讨论话题:你希望下一个版本的Excel增加什么功能? 在2006年以前,很多人都说,希望Excel能提高单表处理数据的数量上限,最好能像Access那样可以建立多表查询。 自Excel 2007问世后,单表处理数据的量,从65,536行增加到了1,048,576行。 于是,很多人表示相当满意,但还是有一些人表示,只是简单增加单表的行数不够
博文视点Broadview
2023/05/06
1.1K0
从工作表函数到DAX!
PP-基础知识:为什么在数据模型里做了数据筛选,图表没有跟着变?
第一,注意不要和Power Query的数据操作混淆,在Power Query里做了数据筛选,最后得到的数据是筛选后的结果,因为Power Query就是针对数据本身进行处理的(PQ其实也不删除数据,只是你习惯性的只使用筛选后的数据结果而已)。
大海Power
2021/08/30
5950
复杂表源的清洗方法
上篇推文《从【中国式复杂报表】谈设计逻辑》中我们提到,中国式复杂报表作为高度复杂化的产物,不适合进一步用作数据源。但实际工作中,难免遇到以类似复杂表格作为数据源的情况。比如从国家统计局下载数据的表单,就是一个初级版的复杂报表。我们可以看到,表头分了两个层级,且子层级含有合计数。列方向上也有合计(全国)。本文将来一步一步介绍,如何清洗复杂报表数据源。
btharp
2021/08/31
2.1K0
Power Query 真经 - 第 7 章 - 常用数据转换
分析师面临的普遍问题是,无论从哪里获得数据,大部分情况都是一种不能立即使用的状态。因此,不仅需要时间把数据加载到文件中,还得花更多的时间来清洗它,改变它的结构,以便后续做分析的时候能更好的使用这个数据。
BI佐罗
2022/05/17
7.7K0
Power Query 真经 - 第 7 章 - 常用数据转换
PBI-基础入门:通过一个简单的案例体会Power BI的数据分析过程
大海:好吧,Power Query你学了那么多,Power Pivot也基本入门了,Power BI也可以同步开始学了,反正PQ和PP的知识除了操作上有一点点儿区别外,都是能在Power BI里直接用的。
大海Power
2021/08/30
3.6K0
Power Query 真经 - 第 8 章 - 纵向追加数据
数据专业人员经常做的工作之一是将多个数据集追加到一起。无论这些数据集是包含在一个 Excel 工作簿中,还是分布在多个文件中,问题是它们需要被纵向【追加】到一个表中。
BI佐罗
2022/05/17
7K0
Power Query 真经 - 第 8 章 - 纵向追加数据
一次性学懂Excel中的Power Query和Power Pivot使用
👆点击“博文视点Broadview”,获取更多书讯 传统的Excel单表虽然可以有100万行数据的承载量,但是在实际分析时,20万行的数据就已经让传统的Excel非常吃力了。 但是,如果使用Excel中的Power Query和Power Pivot商务智能组件,即使是上百万行数据,也可以在短时间内快速完成处理和分析。 Power Query在Excel和Power BI Desktop中都是内置组件,并且管理界面和知识体系保持了高度一致。 其实,Power BI中的Power Query和Power P
博文视点Broadview
2022/10/10
9.6K0
一次性学懂Excel中的Power Query和Power Pivot使用
推荐阅读
相关推荐
PP-数据建模:既然可以直接用,为什么还自己写度量公式?
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档