首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

每个帖子的评论数

每行可以是一个帖子或对该帖子的评论。 如果是帖子的话,parent_id 就是 null。 对于评论来说,parent_id 就是表中对应帖子的 sub_id。...编写 SQL 语句以查找每个帖子的评论数。 结果表应包含帖子的 post_id 和对应的评论数 number_of_comments 并且按 post_id 升序排列。...Submissions 可能包含重复的评论。您应该计算每个帖子的唯一评论数。 Submissions 可能包含重复的帖子。您应该将它们视为一个帖子。...表中 ID 为 3 的评论重复出现了,所以我们只对它进行了一次计数。 表中 ID 为 2 的帖子有 ID 为 5 和 10 的两个评论。 ID 为 12 的帖子在表中没有评论。...表中 ID 为 6 的评论是对 ID 为 7 的已删除帖子的评论,因此我们将其忽略。

66800
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    【精选好文】Reddit如何统计每个帖子的浏览量

    所以我们想要建立一个能够计算一个帖子浏览数的系统。这一数字会被展示给帖子的创作者和版主,以便他们更好的了解某个帖子的活跃程度。 在这篇博客中,我们将讨论我们是如何实现超大数据量的计数。...这种实现方式对于访问量低的帖子是可行的,但一旦一个帖子变得流行,访问量剧增时就很难控制了。甚至有的帖子有超过 100 万的独立访客!...如果我们需要存储 100 万个独立访客的 ID, 每个用户 ID 8 字节长,那么为了存储一篇帖子的独立访客我们就需要 8 M的内存。反之,如果采用 HLL 会显著减少内存占用。...在我们的计数系统架构中,第一部分是一个 Kafka 的消费者,我们称之为 Nazar。Nazar 会从 Kafka 中读取每个事件,并将它通过一系列配置的规则来判断该事件是否需要被计数。...其中一个我们不将一个事件计算在内的原因就是同一个用户在很短时间内重复访问。Nazar 会修改事件,加上个标明是否应该被计数的布尔标识,并将事件重新放入 Kafka。 下面就到了系统的第二个部分。

    1.4K40

    【每日SQL打卡】​​​​​​​​​​​​​​​DAY 21丨每个帖子的评论数【难度中等】​

    每行可以是一个帖子或对该帖子的评论。 如果是帖子的话,parent_id 就是 null。 对于评论来说,parent_id 就是表中对应帖子的 sub_id。...编写 SQL 语句以查找每个帖子的评论数。 结果表应包含帖子的 post_id 和对应的评论数 number_of_comments 并且按 post_id 升序排列。...Submissions 可能包含重复的评论。您应该计算每个帖子的唯一评论数。 Submissions 可能包含重复的帖子。您应该将它们视为一个帖子。...表中 ID 为 3 的评论重复出现了,所以我们只对它进行了一次计数。 表中 ID 为 2 的帖子有 ID 为 5 和 10 的两个评论。 ID 为 12 的帖子在表中没有评论。...表中 ID 为 6 的评论是对 ID 为 7 的已删除帖子的评论,因此我们将其忽略。

    41920

    「SQL面试题库」 No_83 每个帖子的评论数

    2、今日真题 题目介绍: 每个帖子的评论数 number-of-comments-per-post 难度简单 SQL架构 表 Submissions 结构如下: +-------------...每行可以是一个帖子或对该帖子的评论。 如果是帖子的话,parent_id 就是 null。 对于评论来说,parent_id 就是表中对应帖子的 sub_id。...编写 SQL 语句以查找每个帖子的评论数。...Submissions 可能包含重复的评论。您应该计算每个帖子的唯一评论数。 Submissions 可能包含重复的帖子。您应该将它们视为一个帖子。...表中 ID 为 3 的评论重复出现了,所以我们只对它进行了一次计数。 表中 ID 为 2 的帖子有 ID 为 5 和 10 的两个评论。 ID 为 12 的帖子在表中没有评论。

    6500

    Pod的生命周期以及每个阶段的特点

    图片Pod生命周期分为以下几个阶段:Pending(等待中):Pod被创建但还未被调度到节点上运行。在这个阶段,Pod可能还在下载容器镜像,或者等待其他资源的创建。...在这个阶段,Pod中的容器正在执行,可能有一些初始化活动,例如启动应用程序或处理请求。Succeeded(成功):Pod中的所有容器已成功地完成了它们的任务并退出。...Failed(失败):Pod中的容器出现错误或者非正常情况退出。例如,容器内部发生错误或者某些依赖资源无法访问。Unknown(未知):Pod的状态无法确定。可能是因为无法与Pod所在的节点通信。...Pod的生命周期可以是线性的,从Pending到Running再到Succeeded或Failed;也可以是循环的,一个Pod可能在Running状态下失败并进入Failed状态,然后重新启动并再次进入...Pod的生命周期可以通过kubectl get pods命令来查看和监控,可以使用kubectl describe pod 命令查看每个Pod的详细信息。

    59491

    DevOps: 每个阶段最常用的工具有哪些?

    带有DevOps特性的工具列表每天都在增长,了解团队的需求对于使用正确的服务来促进新应用程序的开发非常重要。本文将按类别了解不同的 Devops 工具,以提高团队的生产力和协作。...在之前的文章中,我们看到传统上这些团队的利益是相反的:开发人员应该创造价值并使产品/服务更具创新性,而运营人员的目标是保持基础设施的稳定性。 Devops 文化的优势是多方面的。...最常用的平台之一是Jenkins,这是一个开源工具(虽然可能很难开始使用)。...您可以单独发挥每个工具的性能并使其适应您的需求:Logstash 用于规范化/发送日志,Elasticsearch 用于存储,Kibana 用于可视化。...使用 Jira,开发团队的每个成员都可以跟踪项目的进度并设置 sprint 优先级。 另一方面,Trello因其在管理项目的各种任务方面的直观性和简单性而脱颖而出。

    95620

    DevOps: 每个阶段最常用的工具有哪些?

    带有DevOps特性的工具列表每天都在增长,了解团队的需求对于使用正确的服务来促进新应用程序的开发非常重要。本文将按类别了解不同的 Devops 工具,以提高团队的生产力和协作。...在之前的文章中,我们看到传统上这些团队的利益是相反的:开发人员应该创造价值并使产品/服务更具创新性,而运营人员的目标是保持基础设施的稳定性。 Devops 文化的优势是多方面的。...最常用的平台之一是Jenkins,这是一个开源工具(虽然可能很难开始使用)。...您可以单独发挥每个工具的性能并使其适应您的需求:Logstash 用于规范化/发送日志,Elasticsearch 用于存储,Kibana 用于可视化。...使用 Jira,开发团队的每个成员都可以跟踪项目的进度并设置 sprint 优先级。 另一方面,Trello因其在管理项目的各种任务方面的直观性和简单性而脱颖而出。

    69330

    Jenkins 可视化阶段视图的改进

    最近发布了的一些变更给了流水线编辑者新的工具以改善在 Blue Ocean 中的流水线可视化,有一个备受瞩目关注的工单JENKINS-39203,这会导致当流水线的构建结果为不稳定时所有的阶段都被设置为不稳定的...历史 Jenkins 流水线步骤可以以两种方式完成:成功并返回一个结果(可能为 null),或者是失败的,并抛出一个异常。...再次查看下 JENKINS-39203,我们看到关于可视化有两项基本的选项。...为了解决该问题,部分用户尝试通过抛出异常并在阶段中增加 try/catch 这样的代码块用于处理异常,这样 Blue Ocean 能够借助这些异常来标记步骤和阶段的结果为期望的状态,而且,捕获异常后,流水线可以继续正常执行...请查看 Jenkins 开发者邮件列表中的这个帖子,如果你遇到任何问题了,可以在那里提问。

    1.6K40

    每个机器学习项目必须经过的五个阶段

    现在我们已经绘制了食物的两个特点,脆脆和甜美,并将每个聚类分类,我们可以开始做出预测。在下面的图表中,我们添加一个中等甜度和中等松脆的番茄。...另一种非常受欢迎的用于分类的机器学习模型是决策树。决策树因为高效而受欢迎,即使有多个维度,人类也可以很好地理解它们。决策树对于人类来说是如此容易理解的地方不是它们的计算原理(这实际上相当复杂)。...例如,在评估信用评估决策树时,我们会为决策树提供消费者的数据不包括表明他们是否拖欠贷款的数据。而是要求模型预测提供数据中每个消费者的贷款违约情况。...发生这种情况时,我们重复第3阶段,并在部分数据上训练新模型,然后在第4阶段评估我们的新模型的性能。然后,我们又回到了这里。...如果数据的表现比预计要好,最好的方法可能是坚持使用当前的模型,并调优模型的超参数。模型的超参数是在数据训练模型之前设置的。大多数模型会包含多个超参数,每个超参数可以通过多种方式进行调整。

    2K50

    每个阶段的程序员都是需要提高自己的技能

    程序员的进化之路 初级 -> 中级 通常在初级这个阶段是进步空间最大的阶段这个阶段是不存在天花板的。 编码 编码是初级阶段最需要经常做的事情古话说孰能生巧写代码也是同样的道理。...遇到一些不会写的哪怕找到可以参考的代码跟着抄一遍也行。 工作 大部分时间都在工作那么如何合理的利用好 8 小时工作时间呢。...有机会去参与平时使用到的一些开源技术栈的共建比如想实现每个 feature 但现有开源库不满足实现难度不大的情况下可以去提一个 pull request。...优化工作流程 不仅要熟悉从需求-开发-联调-测试-上线的每个工作环节还要多思考每个环节有没有可以提升的点特别是上线过程比如能不能做到自动化能不能做到小流量上线能不能及时回滚代码。...技术广度 除了自己工作中的使用的技术栈之外也要了解同类其它优秀的开源技术栈从多个维度feature 完整性、文档、上手难度、维护力度、生态等去做对比。

    34820

    技术分享 | MySQL 在线开启 GTID 的每个阶段是要做什么

    GTID 的开启或关闭,从个人角度而言,我也更倾向于大家做在线开启或关闭 GTID 的操作,一方面该操作能尽可能小的影响数据库停机时间,另一方面在开启或关闭的过程中也顺便可以验证该参数的调整是否会对应用造成影响...,该步骤就是一个单纯的过渡属性(注意是为在线关闭 GTID 准备的),执行完后可快速到下一个阶段 ## 该操作在主从库均执行 SET @@GLOBAL.GTID_MODE = OFF_PERMISSIVE...设置 GTID_MODE为ON_PERMISSIVE 该操作依旧是一个过渡属性,其表示的则是新产生的都是 GTID 事务,但也允许有匿名事务被复制,从这个阶段开始就已经是一个正式转化的过程,但依旧是对两种事务做兼容...触发一轮日志切换 FLUSH LOGS 该操作的目的是为了在主库触发 binlog 的轮换,使新生成的 binlog 都是包含 GTID 的事务(防止一个 binlog 中包含2种类型的事务日志) ##...,其中更重要的反而是在正式开启之前的一个校验过程。

    55630

    Ceph集群的组成架构以及每个组成部分的作用和关系

    Ceph集群的组成架构如下:1. Ceph Monitors (监视器):作用:监控集群中每个OSD的状态、位置和负载,并维护PGmap和CRUSH map等重要的元数据。...关系:监视器是集群中的关键组件,至少需要3个监视器以实现容错性,通过选举机制来选择一个活跃的监视器。2. Ceph OSDs (对象存储守护进程):作用:负责存储和管理数据,以及执行数据的读写操作。...关系:OSD负责将数据根据CRUSH map的规则分布到正确的位置,并处理数据副本、数据修复、数据恢复等任务。3....这些组成部分的关系如下图所示: +------------------+ | Ceph Monitors | +---------...,OSD负责数据的存储和管理,CRUSH map定义了数据的分布规则,元数据服务器管理文件系统的元数据,网关提供对象存储的访问接口。

    61021

    使用领域特定Jenkins知识增强现有的LLM模型

    里程碑 该项目包括我们已经经历的几个阶段: 阶段 #1:数据收集 使用不同的来源来收集 Jenkins 知识,例如 jenkins 文档和博客、discource 社区问题 以及许多外部来源,例如 stack...阶段 #2:数据预处理和细化 此阶段包括 3 个部分: 第一个是利用另一个大型语言模型来帮助我们从 Jenkins 文档中生成问答对。...最后一部分是利用 Discourse 上提供的社区问题,我们可以使用 discource api 来修剪 Jenkins 帖子并检索具有已批准解决方案的帖子,然后我们可以执行另一个请求来检索这些帖子及其答案...所有这些部分都是自动化的,并且用于创建数据集的笔记本在我们的存储库中提供。为此,我们设法收集了大约 4100 对;其中一部分用于微调我们的模型。...阶段 #3:JenAI 作为一个系统 此阶段是关于创建具有友好用户界面的软件作为该项目的一部分,以与模型进行交互。我们使用 ReactJs、Typescript 和 MUI 组件来帮助我们创建界面。

    13410

    CICD 工具选型:Jenkins 还是 Bamboo?

    其中有趣的部分是在开发阶段中引入自动化。当我们谈到集成和交付时,另一个与之匹配的过程是“持续测试”,或者有时我们称之为 DevOps 测试。...并行性 Jenkins 和 Bamboo 都支持并行构建。对于 Bamboo 服务器,默认情况下每个阶段都有一个作业,但是可以用它对多个作业进行分组。...为了在 Bamboo 中并行执行作业,必须有多个代理(即作业在多个代理上并行处理)。每个阶段都必须完成它所有的作业,计划的下一阶段才会开始执行。...每个作业中的任务是顺序执行的; 每个阶段中的作业是并行执行的; 每个计划中的阶段是顺序执行的。...在撰写本文时,社区中关于 Bamboo 服务器的帖子有 7890 篇。除了支持论坛,Atlassian 官方博客上也有关于 Bamboo 的博文。

    6K10

    这500多个字段引起的问题,大部分DBA都搞不定

    下面是innodb B+树的结构,我们可以想象一下二分查找时,一个页的只有一条数据会是什么样子。 ? 每个页只有一条数据的查找就变成了链表查找,这样就没有二分查找的意义了。...除了长度,对每个表有多少个列的个数也是有限制的,这里简单说一下: MySQL Server层规定一个表的字段个数最大为 4096; InnoDB层规定一个表的字段个数最大为1017; [官方文档相关说明...,超过的部分存储在溢出页(overflow page)中,同时当前页中增加一个 20 个字节的指针(即 SPACEID + PAGEID + OFFSET)和本地长度信息(2 个字节),共计 768 +...这里提到溢出页,其实就是MySQL的一种数据存储机制,当一条记录中的内容,无法存储在单独的一个页内(比如存储一些大的附件),MySQL 会选择部分列的内容存储到其他数据页中,这种仅保存数据的页就叫溢出页...每个记录(ROW)中还存在元信息: 1. header信息(5个字节) 2. 列是否为null的 bitmap信息(ceil(x/8) 向上取整) 3.

    1.8K30
    领券