首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

Reddit 如何实现大规模的帖子浏览计数

然后将该数量展示给内容创建者和版主,以便他们更好地了解特定帖子上的活动。 在这篇文章中,我们将讨论我们如何大规模地实现计数。 计数方法 对浏览计数有四个主要要求: ◈ 计数必须是实时的或接近实时的。...为了实时保持准确的计数,我们需要知道某个特定的用户是否曾经访问过这个帖子。要知道这些信息,我们需要存储先前访问过每个帖子的用户组,然后在每次处理对该帖子的新访问时查看该组。...当用户查看帖子时,事件被激发并发送到事件收集器服务器,该服务器批量处理事件并将其保存到 Kafka 中。 从这里,浏览计数系统有两个按顺序运行的组件。...如果事件被标记为计数,那么 Abacus 首先检查 Redis 中是否存在已经存在与事件对应的帖子的 HLL 计数器。...为了保持对可能从 Redis 删除的旧帖子的维护,Abacus 定期将 Redis 的完整 HLL 过滤器以及每个帖子的计数记录到 Cassandra 集群中。

1.3K90
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    如何使用 Redis 实现大规模的帖子浏览计数

    img 本文我们就来聊一聊,Reddit 是如何在大规模下统计帖子浏览量的。 统计方法 我们对统计浏览量有四个基本的要求 计数必须达到实时或者接近实时。 每个用户在一个时间窗口内仅被记录一次。...帖子显示的统计数量的误差不能超过百分之几。 整个系统必须能在生成环境下,数秒内完成阅读计数的处理。 满足上面四个条件,其实比想象中要复杂。...Nazar会在事件被发送回kafka时,为事件添加一个标识位,根据该事件是否被加入到计数当中的布尔值。...,如果事件被计数,Abacus会首先检查这个事件中文章的HLL计数是否存在于Redis中,如果存在,Abacus会发送一个PFADD请求给Redis,如果不存在,Abacus会发生一个请求到Cassandra...集群,Cassandra集群会持久化HLL 计数和真实的原始计数数据,然后再发送一个SET请求到Redis,这个过程通常出现在用户阅读一个已经被Redis剔除的就文章的情况下发送。

    2.1K40

    X电容与Y电容

    X电容和Y电容统称为安规电容,安规电容即经过安全认证的电容,经过国家权威机构检验测试通过的交流电容,产品有各国认证标志。失效后,不会导致电击,不危及人身安全。...一般选用金属薄膜电容,X电容是uF级,X电容抑制差模干扰。 X电容(金属化聚丙烯薄膜电容器)的全称一般叫:X2(X1/X3/MKP)抑制电源电磁干扰用电容器。...X电容分为X1, X2, X3,主要差别在于: X1耐高压大于2.5 kV,小于等于4 kV,目前这种电容需求不是太多,预计未来也会成为需求趋势 X2耐高压小于等于2.5 kV; X3耐高压小于等于1.2...Y电容底下又分为Y1, Y2, Y3,Y4,主要差别在于: Y1 额定电压≤500VAC,峰值电压等于8 kV,实验电压4000VAC Y2额定电压≥150VAC,≤500VAC,峰值电压等于5 kV,...X 电容的容值允许比Y 电容大,但必须在X 电容的两端并联一个安全电阻,用于防止电源线拔插时,由于该电容的充放电过程而致电源线插头长时间带电。

    1K10

    R语言建模入门:如何理解formula中y~.和y~x:z的含义?

    01 — 如何理解formula中y~.和y~x:z的含义? y~. 和 y~x:z 是一个简单的formula。~和 : 是formula中的运算符,但它们与通常理解的数学运算符存在一定的差距。...注意R语言中默认表达式带常数项,因此估计 只需要写y~x。 - :-表示从模型中移除某一项,y~x-1表示从模型中移除常数项,估计的是一个不带截距项的过原点的回归方程。...此外,y~x+0或y~0+x也可以表示不带截距项的回归方程。...(←是大写的i不是小写的L) y~x+I(z^2)的含义: y~x+z^2的含义: (因为z没法和自己交互) 那么,y~x+w+z和y~x+I(w+z)有什么区别呢?...y~x+w+z的含义: y~x+I(w+z)的含义: 可以发现,第二个公式将w+z作为一个整体估计这一变量的参数。

    8K31

    说一下使用 Redis 实现大规模的帖子浏览计数的思路

    说一下使用 Redis 实现大规模的帖子浏览计数的思路 统计方法 本文我们就来聊一聊,Reddit 是如何在大规模下统计帖子浏览量的。...统计方法 我们对统计浏览量有四个基本的要求 计数必须达到实时或者接近实时。 每个用户在一个时间窗口内仅被记录一次。 帖子显示的统计数量的误差不能超过百分之几。...整个系统必须能在生成环境下,数秒内完成阅读计数的处理。 满足上面四个条件,其实比想象中要复杂。...,如果事件被计数,Abacus会首先检查这个事件中文章的HLL计数是否存在于Redis中,如果存在,Abacus会发送一个PFADD请求给Redis,如果不存在,Abacus会发生一个请求到Cassandra...集群,Cassandra集群会持久化HLL 计数和真实的原始计数数据,然后再发送一个SET请求到Redis,这个过程通常出现在用户阅读一个已经被Redis剔除的就文章的情况下发送。

    11410
    领券