首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

mysql写count不重复

基础概念

COUNT 是 MySQL 中的一个聚合函数,用于计算表中某列的行数。当使用 COUNT(DISTINCT column_name) 时,它会计算指定列中不同值的数量。

相关优势

  1. 高效统计COUNT(DISTINCT ...) 可以高效地统计某一列中不同值的数量,而不需要对整个表进行全表扫描。
  2. 数据去重:通过 DISTINCT 关键字,可以确保统计的是不重复的值,这在很多场景下是非常有用的。

类型

在 MySQL 中,COUNT 函数主要有两种类型:

  1. COUNT(*):计算表中的总行数。
  2. COUNT(DISTINCT column_name):计算指定列中不同值的数量。

应用场景

  1. 统计用户活跃度:例如,统计某一时间段内登录过的不同用户数量。
  2. 去重统计:例如,在电商网站中统计不同商品的销售数量。
  3. 数据清洗:在数据预处理阶段,用于检查和处理重复数据。

遇到的问题及解决方法

问题:为什么 COUNT(DISTINCT ...) 执行速度慢?

原因

  1. 大数据量:当表中的数据量非常大时,计算不同值的数量会变得非常耗时。
  2. 索引缺失:如果没有为指定列创建索引,MySQL 可能需要进行全表扫描,导致性能下降。

解决方法

  1. 优化查询:尽量减少查询的复杂度,例如通过子查询或临时表来优化。
  2. 创建索引:为指定列创建索引,可以显著提高 COUNT(DISTINCT ...) 的执行速度。
  3. 分页查询:如果数据量非常大,可以考虑分页查询,避免一次性加载过多数据。

示例代码

假设有一个用户登录日志表 user_login_log,结构如下:

代码语言:txt
复制
CREATE TABLE user_login_log (
    id INT AUTO_INCREMENT PRIMARY KEY,
    user_id INT NOT NULL,
    login_time DATETIME NOT NULL
);

要统计某一时间段内登录过的不同用户数量,可以使用以下 SQL 语句:

代码语言:txt
复制
SELECT COUNT(DISTINCT user_id) AS unique_users
FROM user_login_log
WHERE login_time BETWEEN '2023-01-01 00:00:00' AND '2023-01-31 23:59:59';

参考链接

MySQL COUNT(DISTINCT) 详解

总结

COUNT(DISTINCT ...) 是 MySQL 中用于统计某一列中不同值数量的重要函数。在使用时,需要注意数据量大小和索引的创建情况,以优化查询性能。通过合理的优化和索引策略,可以有效解决执行速度慢的问题。

页面内容是否对你有帮助?
有帮助
没帮助

相关·内容

MYSQL 下 count(*)、count(列)、 count(1) 理解

count(列名)只包括列名那一列,在统计结果的时候,会忽略列值为空(这里的空不是只空字符串或者0,而是表示null)的计数,即某个字段值为NULL时,不统计。...> call sp_name(); Query OK, 0 rows affected mysql> select count(*) from t; +----------+ | count(*) |...+----------+ | 10000000 | +----------+ 1 row in set 验证执行效果 cout(*)和count(1) 没区别,但是cout(列名) 不统计为 null...| +----------+ 1 row in set mysql> select count(1) from t; +----------+ | count(1) | +----------+ |...*name 的执行计划 type = All 是进行的全表扫描,而count(*) count(1), count(列,主键) 的type 是null,执行时甚至不用访问表或索引 MySQL5.7文档中有一段话

2.5K41

MySQL count()函数及其优化count(1),count(*),count(字段)区别

(1),count(*),count(字段)区别 count(1)和count(*) 作用 都是检索表中所有记录行的数目,不论其是否包含null值 区别 count(1)比count(*)效率高 二 ....count(字段)与count(1)和count(*)的区别 count(字段)的作用是检索表中的这个字段的非空行数,不统计这个字段值为null的记录 任何情况下SELECT COUNT(1) FROM...WHERE COL2 = ‘value’ 的出现 如果表没有主键,那么count(1)比count(*)快 如果有主键,那么count(主键,联合主键)比count(*)快 如果表只有一个字段,count...(*)最快 count(1)跟count(主键)一样,只扫描主键。...count(*)跟count(非主键)一样,扫描整个表 明显前者更快一些。

2.9K60
  • MySQL中count(字段) ,count(主键 id) ,count(1)和count(*)的区别

    注意:count(1)执行速度比count(主键 id)快的原因:从引擎返回 id 会涉及到解析数据行,以及拷贝字段值的操作。 count(*) MySQL 执行count(*)在优化器做了专门优化。...因为count(*)返回的行一定不是空。扫描全表,但是不取值,按行累加。...看到这里,你会说优化器就不能自己判断一下吗,主键 id 肯定是非空的,为什么不能按照 count(*) 来处理,多么简单的优化。当然 MySQL 专门针对这个语句进行优化也不是不可以。...但是这种需要专门优化的情况太多了,而且 MySQL 已经优化过 count(*) 了,你直接使用这种语句就可以了。...性能对比结论 count(可空字段) count(非空字段) = count(主键 id) count(1) ≈ count(*)

    2.5K30

    MySQL中count(字段) ,count(主键 id) ,count(1)和count(*)的区别

    注意:count(1)执行速度比count(主键 id)快的原因:从引擎返回 id 会涉及到解析数据行,以及拷贝字段值的操作。 count(*) MySQL 执行count(*)在优化器做了专门优化。...因为count(*)返回的行一定不是空。扫描全表,但是不取值,按行累加。...看到这里,你会说优化器就不能自己判断一下吗,主键 id 肯定是非空的,为什么不能按照 count(*) 来处理,多么简单的优化。当然 MySQL 专门针对这个语句进行优化也不是不可以。...但是这种需要专门优化的情况太多了,而且 MySQL 已经优化过 count(*) 了,你直接使用这种语句就可以了。...性能对比结论 count(可空字段) count(非空字段) = count(主键 id) count(1) ≈ count(*) 发布者:全栈程序员栈长,转载请注明出处:https://javaforall.cn

    2.4K10

    高性能MySQL——Count(1) OR Count(*)?(转)

    count(列名)某个字段值为NULL时,不统计 如果问一个程序员MySQL中SELECT COUNT(1)和SELECT COUNT(*)有什么区别,会有很多人给出这样的答案“SELECT COUNT...结论是:这俩在高版本的MySQL(5.5及以后,5.1的没有考证)是没有什么区别的,也就没有COUN(1)会比COUNT(*)更快这一说了。 WHY?...这就要从COUNT()函数的具体含义说起了。” COUNT()有两个非常不同的作用:它可以统计某个列值的数量,也可以统计行数。在统计列值时要求列值是非空的(不统计NULL)。...当MySQL确认括号内的表达式值不可能为空时,实际上就是在统计行数。...最简单的就是当我们使用COUNT(*)的时候,这种情况下通配符*并不像我们猜想的那样扩展成所有的列,实际上,他会忽略所有列而直接统计所有的行数“——《高性能MySQL》。

    3.2K30

    MySQL中count(*)、count(主键id)、count(字段)和count(1)那种效率更高?

    在 MySQL 中,COUNT 函数是一个非常常用的聚合函数,它用于计算某列或某表达式在查询结果中出现的次数。...其实,它们的性能基本相同,因为在执行时,MySQL 会对这两种写法进行优化。MySQL 会从内存缓存里遍历主键索引,这是一种非常高效的操作方式,而且不需要读取数据页或磁盘块。...但是,在某些特殊情况下,COUNT(*) 可能会比 COUNT(主键id) 稍微快一点,这是因为 MySQL 可以直接通过读取页头来获取表的总记录数,而不需要扫描主键索引。...实际上,在大多数情况下,这两种写法的性能基本相同,因为 MySQL 对它们进行了相同的优化。MySQL 会使用索引或全表扫描统计记录数,对于单表查询的情况,索引扫描通常比全表扫描要快一些。...但是,如果在多表查询的情况下使用 COUNT(1) 或 COUNT(字段),就需要注意它们的性能问题了。在这种情况下,MySQL 必须进行联接操作,然后再统计记录数。

    1.4K30

    MySQL中count(*)、count(主键id)、count(字段)和count(1)那种效率更高?

    但是count(*)是例外,并不会把全部字段取出来,而是专门做了优化,不取值。count(*)肯定不是null,按行累加。...看到这里,你一定会说,优化器就不能自己判断一下吗,主键id肯定非空啊,为什么不能按照count(*)来处理,多么简单的优化啊。 当然,MySQL专门针对这个语句进行优化,也不是不可以。...但是这种需要专门优化的情况太多了,而且MySQL已经优化过count(*)了,你直接使用这种用法就可以了。...其实,把计数放在Redis里面,不能够保证计数和MySQL表里的数据精确一致的原因,是这两个不同的存储构成的系统,不支持分布式事务,无法拿到精确一致的视图。...而把计数值也放在MySQL中,就解决了一致性视图的问题。 InnoDB引擎支持事务,我们利用好事务的原子性和隔离性,就可以简化在业务开发时的逻辑。这也是InnoDB引擎备受青睐的原因之一。

    4.8K50

    MySQL查询---COUNT函数

    count(*),count(id)与count(1)效率对比 实际上对于count(*)和count(1)效率哪个更高,众说纷坛。我们可以先看看效率对比: ? ?...可以发现执行速度两条SQL语句是相差无几的,count(1)和count(*)都是查询全表数据行数,可能网上很多言论会说count(*)其实走的就是count(1)查询,所以使用count(1)查询可以节省转换时间...因为Mysql官方文档写了这么一句话: InnoDB handles SELECT COUNT(*) and SELECT COUNT(1) operations in the same way....我个人建议使用count(*),因为SQL92标准中制定count(*)为标准统计行数的语法,所以Mysql一直在不断地对count(*)做一定的优化。那有人说count(id)效率会不会更高?...例如我们刚才添加的type列表示用户账号是否可用,我们现在需要查询可用账户的总数量就可以这样写: select count(*) from order_info where type = 0; 可以explain

    3.4K20

    Mysql COUNT() 函数详解

    下面开始说今天的正文内容...在使用Mysql的时候,作为开发者,聚合函数是肯定会用到的,下面就来说说我们常用到的统计行数的聚合函数 COUNT()。...COUNT() 的几种用法说到COUNT() 函数,最常用的几种方法就是 COUNT(*) 、COUNT(1)、 COUNT(column),那么关于这几种 COUNT() 函数的不同之处这里就来详细说说...,COUNT() 统计行数通常包括 NULL 和重复项,比如SELECT COUNT(*) FROM sys_post;统计结果如图所示,满足我们的预期,统计了包括NULL在内的数据数量COUNT(1)...下面我们再利用 COUNT(1) 来统计 sys_post表的数据量,其实 COUNT(1) 和 COUNT(*) 差不多,统计表中满足条件的所有数据行数,包括 NULL和重复项,比如SELECT COUNT...BY create_by HAVING COUNT(*)>1;统计结果如图所示到这里关于mysql 统计函数 count() 函数的一些介绍以及基本用法就说完了。

    27510

    测试用例,写不写?

    有的观点认为,现在是敏捷研发,测试都来不及,写什么测试用例。 折中的观点认为测试用例可以写,但是不需要写的那么详细,用导图写个大概就可以了。 你认可哪种观点呢?...常见例如等价类、边界类及错误推测法等等,在这里不展来说啦,网上有太多的资料。文章底部还会推荐一篇关于测试用例设计的“兵器谱”。...如果团队成员的能力较强时,我们只需要罗列出测试点即可,依托于个人的测试经验,来节约编写测试用例的时间成本,但不可以不写用例,它能在你疏忽的时候提醒到你还有哪些测试需要执行。...用例“前置条件”不一定能轻易实现 我们在写用例时,一般都会写前置条件,在用例中写起来可能只是一句话,但这些前置条件其实并不是那么容易构建出来的,比如一些支付场景、审批流、第三方回传数据,甚至于异常场景等等

    40210

    测试用例,写不写?

    有的观点认为,现在是敏捷研发,测试都来不及,写什么测试用例。 折中的观点认为测试用例可以写,但是不需要写的那么详细,用导图写个大概就可以了。 你认可哪种观点呢?...常见例如等价类、边界类及错误推测法等等,在这里不展来说啦,网上有太多的资料。文章底部还会推荐一篇关于测试用例设计的“兵器谱”。...如果团队成员的能力较强时,我们只需要罗列出测试点即可,依托于个人的测试经验,来节约编写测试用例的时间成本,但不可以不写用例,它能在你疏忽的时候提醒到你还有哪些测试需要执行。...用例“前置条件”不一定能轻易实现 我们在写用例时,一般都会写前置条件,在用例中写起来可能只是一句话,但这些前置条件其实并不是那么容易构建出来的,比如一些支付场景、审批流、第三方回传数据,甚至于异常场景等等

    46220

    MySQL中count(*)、count(主键id)、count(字段)和count(1)那种效率更高?「建议收藏」

    但是count(*)是例外,并不会把全部字段取出来,而是专门做了优化,不取值。count(*)肯定不是null,按行累加。...看到这里,你一定会说,优化器就不能自己判断一下吗,主键id肯定非空啊,为什么不能按照count(*)来处理,多么简单的优化啊。 当然,MySQL专门针对这个语句进行优化,也不是不可以。...但是这种需要专门优化的情况太多了,而且MySQL已经优化过count(*)了,你直接使用这种用法就可以了。...其实,把计数放在Redis里面,不能够保证计数和MySQL表里的数据精确一致的原因,是这两个不同的存储构成的系统,不支持分布式事务,无法拿到精确一致的视图。...而把计数值也放在MySQL中,就解决了一致性视图的问题。 InnoDB引擎支持事务,我们利用好事务的原子性和隔离性,就可以简化在业务开发时的逻辑。这也是InnoDB引擎备受青睐的原因之一。

    1.5K40

    MySQL 中 count(*) 比 count(1) 快?

    今天有人跟我讲 MySQL 中 count(1) 比 count(*) 快,这能忍?必须得和他掰扯掰扯。 声明:以下讨论基于 InnoDB 存储引擎,MyISAM 因为情况特殊我在文末会单独说一下。...key_len:这个表示 MySQL 使用的键长度,因为我们的主键类型是 INT 且非空,所以值为 4。...3.2 原理分析 不知道小伙伴们有没有注意过,我们学习 MySQL 的时候,count 函数是归在聚合函数那一类的,就是 avg、sum 等,count 函数和这些归在一起,说明它也是一个聚合函数。...最后再来说说 select count(*) from user; ,这个 SQL 的特殊之处在于它被 MySQL 优化过,当 MySQL 看到 count(*) 就知道你是想统计总记录数,就会去找到一个最小的索引树去遍历...为了支持事务,InnoDB 引入了 MVCC 多版本并发控制,所以在数据读取的时候可能会有脏读、幻读以及不可重复读等问题,具体可以参考 https://www.bilibili.com/video/BV14L4y1B7mB

    1.4K10
    领券