如何在Praw Reddit中限制一级评论？

在Praw Reddit中限制一级评论可以通过设置参数来实现。具体步骤如下：

首先，导入Praw库并进行身份验证，确保你有权限对Reddit进行操作。

import praw

reddit = praw.Reddit(client_id='YOUR_CLIENT_ID',
                     client_secret='YOUR_CLIENT_SECRET',
                     user_agent='YOUR_USER_AGENT',
                     username='YOUR_USERNAME',
                     password='YOUR_PASSWORD')

找到你想要限制评论的帖子。可以使用reddit.subreddit('subreddit_name').submission('post_id')来获取特定帖子。

submission = reddit.subreddit('subreddit_name').submission('post_id')

设置帖子的comment_limit参数来限制一级评论的数量。你可以将其设置为你想要的任何整数值。

submission.comment_limit = 10

如果你想要限制一级评论的深度，可以设置帖子的comment_sort参数。可以选择的值包括'best'、'top'、'new'、'controversial'和'old'。

submission.comment_sort = 'best'

最后，通过使用submission.comments.replace_more(limit=None)来获取所有评论，包括一级评论和更深层次的回复。

submission.comments.replace_more(limit=None)

完成上述步骤后，你就成功地在Praw Reddit中限制了一级评论。请注意，这只是一种方法，具体实现可能因你的需求而有所不同。

相关·内容

如何使用 Python 抓取 Reddit网站的数据？

有 2 种类型的 praw 实例：只读实例：使用只读实例，我们只能抓取 Reddit 上公开的信息。例如，从特定的 Reddit 子版块中检索排名前 5 的帖子。...授权实例：使用授权实例，您可以使用 Reddit 帐户执行所有操作。可以执行点赞、发帖、评论等操作。...在本教程中，我们将仅使用只读实例。抓取 Reddit 子 Reddit 从 Reddit 子版块中提取数据的方法有多种。Reddit 子版块中的帖子按热门、新、热门、争议等排序。...我们需要 praw 模块中的 MoreComments 对象。为了提取评论，我们将在提交对象上使用 for 循环。所有评论都会添加到 post_comments 列表中。...我们还将在 for 循环中添加一个 if 语句来检查任何评论是否具有 more comments 的对象类型。如果是这样，则意味着我们的帖子有更多可用评论。因此，我们也将这些评论添加到我们的列表中。

1.4K2 0

使用Python Dash，主题分析和Reddit Praw API自动生成常见问题解答

很多时候对与他们一直在搜索的内容无关的评论数量感到沮丧。以Reddit为例，主页上有很多帖子。所有的信息杂乱都很难跟踪。...其他工具如Github for Version Control也将实施。...身份验证从使用Reddit的praw库开始。由于有许多可用资源，不会详细讨论如何准备好身份验证。...相关链接如下： http://www.storybench.org/how-to-scrape-reddit-with-python/ Reddit praw代码输入授权配置文件然后将获得将被导出的...Reddit Code获得某个subreddit频道接下来使用以下元数据将hot_python导出到topics.csv 从Reddit Praw中提取帖子后检索的元数据主题提取本节说明如何在

2.3K2 0

RedditC2：一款基于Reddit API的C2流量托管工具

关于RedditC2 RedditC2是一款基于Reddit API的C2流量托管工具，该工具能够使用Reddit API来托管C2流量，由于大部分蓝队研究人员都会使用Reddit，因此使用Reddit...接下来，使用下列命令安装工具所需的PRAW库： pip3 install praw 工具下载广大研究人员可以使用下列命令将该项目源码克隆至本地： git clone https://github.com...Post，然后使用命令“in:”发布一个新的评论； 2、读取包含了单词“out:”的新评论； 3、如果没有找到这样的评论，则返回第二步； 4、解析并解密评论，并读取输出； 5、将现有评论编辑修改为“executed...”以避免命令重复执行； Client 1、访问一个指定的Reddit Post，然后读取包含了“in:”的最新评论； 2、如果没有检测到新的评论，则返回第一步； 3、解析并解密评论中的命令，然后在本地执行...； 4、加密命令的输出结果，并在相应的评论中回复（“out:”）；工具使用截图下面给出的是异或加密的C2流量演示：扫描结果由于该工具本质上属于一个自定义C2植入物，因此我们需要使用反病毒产品来进行检测和测试

3023 0

如何用 GPT2 和 BERT 建立一个可信的 reddit 自动回复机器人？

步骤 0：从你最喜欢的 reddit 文章中获取一些 reddit 评论数据，并将其格式化为类似「comment[SEP]reply」的字符串步骤 1：微调 GPT-2 以生成格式为「comment[...SEP]reply」的 reddit 文本步骤 2：微调两个 BERT 分类器： a：区分真实回复和 GPT-2 生成的回复 b：预测评论将获得多少次支持步骤 3：使用 praw 下载当前评论步骤...4：使用微调的 GPT2 为每个评论生成多个回复步骤 5：将生成的回复传递给两个 BERT 模型，以生成对真实性和投票数的预测步骤 6：使用一些标准来选择要提交的回复步骤 7：使用 praw 提交所选评论...用PRAW拉实时评论尽管我可以使用 bigquery 上的数据生成训练集，但大多数数据实际上都是几个月前的。...幸运的是，我可以使用 praw 库和下面的代码片段，从几个我认为会产生一些有趣响应的 reddit 中的前 5 个「上升」帖子中获取所有评论。

3.3K3 0

人的情绪岂止6种？Google发布大规模数据集GoEmotions，情感类别提升到28种

Google 最近就带来了一个全新的情绪数据集GoEmotion，包含了58000个人工标注的Reddit 评论，并且将情绪分为28个类别。...这一点尤其重要，因为Reddit的平台也具有用户群体的偏差，年轻的男性使用者居多，其中的评论也无法反映全球不同的人口的情绪表达。...并且Reddit 还有一些攻击性的语言，为了解决这些问题，需要使用预先定义的攻击性、少儿不宜、粗俗内容以及宗教的术语来识别和过滤劣质评论。...除此之外，Google还对数据进行了额外的过滤，如限制文本长度，并对数据集中所表达的情感和感受进行平衡，防止过度某些情感占比过多。...并且还额外增加了rater在数据标注过程中建议新增的情绪，这些情绪能够很好地描述在评论数据中的情绪。

1.3K2 0

【Java】已解决：net.dean.jraw.http.NetworkException异常

该异常通常发生在尝试通过网络请求获取Reddit数据时，例如获取帖子列表或提交评论等操作。...场景：在一个Java应用中，开发者试图通过JRAW库从Reddit获取指定子版块（subreddit）的帖子列表。...在网络请求过程中，由于某些原因（如网络连接问题或API调用限制），抛出了NetworkException异常。...API调用限制：Reddit对API调用频率有限制，超过限制会导致请求失败。认证问题：OAuth认证失败或凭据无效。服务器错误：Reddit服务器返回错误响应，如500内部服务器错误。...API调用频率限制：注意Reddit API的调用频率限制，避免因频率过高导致请求失败。认证的正确性：确保OAuth认证凭据正确有效，避免因认证问题导致请求失败。

741 0

学界｜如何捕捉冗长讨论里的目标信息？谷歌推出最大标注数据集

AI科技评论按：很多读者在思考，“我和AI科技评论的距离在哪里？”答案就是：一封求职信。信息爆炸时代，如何在浩瀚如海的网络中找到自己的需求？...Coarse Discourse dataset包含超过10万条人可在线讨论的公开注解，这些是从reddit.com网站中的130个社区，超过9000个主题中随机抽取的。...论文摘要在这项工作中，我们提出了一种新的方法将在线讨论中的评论分类成一些粗糙语料，是为了在一定规模上更好理解讨论这个目标的实现。...使用我们的语料库，我们演示了如何分析话语行为，可以描述不同类型的讨论，包括话语序列，如问答配对，分歧链，以及不同的社区中的表现。...实验结论团队使用了一种新的话语行为的分类，我们推出一个从Reddit上数千个社区采样，最大的人工标注的数据集的讨论，在每个线程上的每个评论根据话语行为和关系注释。

86314 0

评论系统的几种展示结构和存储设计

使用场景和例子嵌套式（树形）评论结构适用于许多在线交互场景，特别是那些需要深度讨论和多层次对话的场合。下面是一些使用嵌套式树形结构的站点Reddit3....：在这种模型中，每个评论都有一个路径字段，记录了从顶级评论到当前评论的路径。...这种结构的主要优点是它可以方便地跟踪和组织讨论的线索，使得用户可以更容易地理解和参与到讨论中。同时限制评论层级，又不至于让用户过度沉浸在评论的交互中，回归主题。2....二层嵌套评论结构的适用场景合理二层嵌套评论结构广泛应用于各种在线社区、论坛、博客和新闻网站等，它允许用户对主题进行评论，同时也可以对其他用户的评论进行回复（对一级评论的回复以父子节点形式组织，对二级评论的回复以平铺方式组织...二层嵌套评论结构的存储设计FieldTypeDescriptioncomment_idINT每个评论的唯一标识符，主键parent_idINT每个评论的父评论的comment_id，对于一级评论，这个字段为

6442 0

开源 | 谷歌发布 Coarse Discourse：迄今为止最大的在线讨论标注数据集

https://research.google.com/pubs/pub46055.html 每天，在线社区论坛的参与者们都分享他们的观点、经验、建议和社会支持，其中大部分分享都是自由表达并且没有什么限制...为了创建这一个数据集，我们开发了一种论坛评论的漫谈话语分类法，该方法通过浏览论坛主题的一个小数据集，并阅读每一条评论，然后再评价每一条评论在讨论中所起的作用。...在这些数据中，有超过 10 万条评论由众包编辑独立地标注了话语类型和关系。...摘要：在该项研究中，我们提出了一种将在线讨论中的评论分类为一组漫谈话语行为的新方法，该方法目的是为了更大规模地理解在线社区的讨论。...我们收集并发布了超过 9000 多个主题 10 万多条评论的语料库，并通过付费众包的方式人工标注从 Reddit 随机抽取的话语行为。

7429 0

Reddit技术分享被群嘲为「无耻的自我宣传」

楼主在帖子中写道，现在只需要添加几行代码，你模型的运行速度就可以提升10倍甚至更多，但你可能根本没有意识到怎么做。...不幸的是，这篇文章被贴上了「无耻的自我宣传」的标签，而对技术问题的回答也被其他评论所掩盖。他恳请那些真正尝试过这个库的人再对这个帖子进行评论。...并怀疑早期的评论和点赞都是买的网络水军。更直接的网友表示，这纯属垃圾信息，不知道这些天reddit发生了什么。...我看到更多的是人们在速度上下功夫，或者如何在代码上打补丁，尽管这对SLA来说不是必要的。分析性能不需要很大工作量，主要是因为很多从业者来自软件工程背景，他们认为可以努力和取得进展的内容就是运行速度。...惹民愤的库根据GitHub库的Readme文件中可以了解到，nebullvm是一个All-in-one的库，用户可以在一行代码中测试多个DL编译器，并将DL模型的推理速度提高5-20倍。

5191 0

高效爬取Reddit：C#与RestSharp的完美结合

对于研究人员和开发者而言，Reddit提供了宝贵的数据源，可用于文本分析、舆情监控和趋势研究等多个领域。然而，由于Reddit的内容实时更新频繁、用户互动活跃，直接爬取其数据面临诸多挑战。...首先，Reddit对频繁的自动化访问有严格的限制，容易触发反爬虫机制，导致IP封禁。其次，高流量请求可能会导致请求速度限制，影响数据获取的效率。...请求头设置：在请求中添加User-Agent和Cookie，以模拟真实用户行为，避免被目标网站识别为爬虫。数据解析和统计：使用Newtonsoft.Json库解析JSON响应内容。...提取帖子标题、得分和评论数，并进行统计分析。...输出部分帖子标题及统计结果，包括帖子数量、平均得分和平均评论数结论通过本文的技术分析和代码实现，展示了如何使用C#和RestSharp库，结合代理IP和多线程技术，实现高效的Reddit内容爬取。

2571 0

DOTA2获胜的AI比AlphaGo厉害？还是媒体和马斯克在联合炒作？

昨天凌晨的DOTA2人机大战中，顶级人类玩家Danylo "Dendi" Ishutin被AI完败。到底这次人机大战意义何在？...众说纷纭中，我们认为前谷歌大脑和斯坦福研究员Denny Britz的这篇评论文章相对中肯和理性，也得到了不少学者的力挺："这个问题实际上比击败人类围棋冠军容易得多。我们并没有在AI中突然进步。"...在1对1中击败对手需要机械技能和短期战术，但没有任何对当前的AI技术来说具有挑战性的需求，如长期规划或团队协调。事实上，你需要采取的有效操作数量少于围棋游戏。...对OpenAI而言，由于环境受到严格限制，（很大可能）可用的操作也受到限制，而且很少或者完全没有进行长期规划或协调的需要，我得出的结论是，这个问题实际上比击败人类围棋冠军容易得多。...虽然这种技术并不是什么新鲜事物，但令人惊讶的是（至少对我来说），机器人自己就学习到了人们使用的技术，如Reddit和Ycombinator上评论中所提出的。

5983 0

7个实用小技巧，提升PyTorch技能，还带示例演示

转自机器之心 PyTorch 是一种非常灵活的深度学习框架，它允许通过动态神经网络（例如利用动态控流——如 if 语句或 while 循环的网络）进行自动微分。...长期以来，为了充分挖掘 PyTorch 的特性，研究人员也提出了各种各样的小技巧，比如如何加快深度学习模型训练的使用、训练完模型以后如何保存模型、如何使用多卡训练以及如何在训练过程中让学习率进行衰减等。...近日，reddit 出现了一个关于 PyTorch 使用技巧的帖子：「PyTorch 的七个实用技巧」，还提供了相关示例，引发网友热议。...一位用户评论道：「即使我用 PyTorch 工作了多年，现在我仍然忘记调用 eval()，我发誓。」还有用户表示：「为什么不使用 nn.Sequential？...usp=sharing 参考链接： https://www.reddit.com/user/SlickBlueML/

7647 0

这个Reddit回答获得了5k+赞

Reddit有位叫做kouhoutek的大咖给出了一个超棒的答案，获得了200+条评论，6700+点赞，还吸引来了各种技术大牛的互相讨论！...接着，下一级节点会根据刚才听到的内容喊出更复杂的特征：“它有一张脸！”，“它有毛皮！”，直到最后，会听到有个声音喊道“这是一只小猫！”。...评论里将这个比喻扩展到RNN 同样，我们可以用上面那个很棒的比喻来解释RNN。假设你的球队要做的决策不再是选择食物这么简单，而是要对正在进行的一系列运动做出判断。例如，假设球队正在进行棒球比赛。...球队中每个队员对赛况都有不同的个人见解，并且在任何时候他们都可以协作对当前的状况做出判断，并据此采取具体行动。同样，这种决策也是基于反馈进行不断学习。...相关报道： https://www.reddit.com/r/explainlikeimfive/comments/7buzbs/eli5_what_are_neural_networks_specifically_rnns

5792 0

如何使用 Redis 实现大规模的帖子浏览计数

来源：http://t.cn/EL1FB0M 统计方法 ---- 英文原文本文翻译自全球访问量排名第8位的论坛Reddit博客上的文章，讲的是关于Reddit如何在海量浏览量下实时统计浏览量的。...img 本文我们就来聊一聊，Reddit 是如何在大规模下统计帖子浏览量的。统计方法我们对统计浏览量有四个基本的要求计数必须达到实时或者接近实时。每个用户在一个时间窗口内仅被记录一次。...满足上面四个条件，其实比想象中要复杂。...基于HyperLogLog (HLL)的计算方法，HLL的内存增长是非线性的，但是统计的精准度和线性概率就不是同一级别的了。...Reddit的浏览统计系统，分为两个顺序执行的组成部分，其中的第一部分是，被称为Nazar的kafka队列『消费者』(consumer) ，它会从kafka中读取事件，然后将这些事件通过特定的条件进行过滤

2.1K4 0

DialoGPT：大规模预训练的对话响应模型

本文介绍了一种大规模、可调整的神经对话响应生成模型DialoGPT（dialogue generative pre-trained transformer），模型在从2005年至2017年Reddit评论链中提取的...无论在自动评估还是人类评估中，DialoGPT都展示了最先进的结果，将表现提升到接近人类回复的水平。 2 数据集数据提取于2005年至2017年Reddit网站的评论链。...Reddit讨论链可视为树结构的回复链，这是由于一条评论回复另一条评论形成了父结点和子结点。作者提取了从根结点到叶子结点每一条路径作为一条包含多种对话的训练样例。...相反，它针对的是类似人类的对话，在这种对话中，潜在的目标通常是不明确的或事先未知的，就像在工作和生产环境（如头脑风暴会议）中人们共享信息时看到的那样。 DSTC-7测试数据包含了Reddit数据对话。...5 限制和风险尽管在训练前尽量避免了攻击性词语，但DialoGPT依旧有输出这些词语的可能。输出也可能隐含了对性别和历史的偏见。

3K4 0

我在肯尼迪航天中心研究太空机器人：揭秘NASA的编程观

互相请教不懂的问题，是大家日常工作中重要的一部分。没有谁高一级或者低一级，只有知道和不知道。...透彻理解计算机系统运行 NASA很重视从根本上去思考和理解计算机系统，通过检视系统中的基础限制何在，可以预防产生不佳决策，这是很有价值的。...在这个空间里，大家可以不用讨论那些“最新的”“更好的”（如开头提到），而是讨论更为重要的东西，像我在文章里写的这些。像其他社区一样，我们也曾走过教条主义的阶段，但将来会更注意不再陷入。...我们也曾访问过一些知名的程序员，他们也发表过他们的一些观点，可以看这里—— 相关媒体 Reddit (2017) https://www.reddit.com/r/programming/comments...id=10095104 Reddit (2015) https://www.reddit.com/r/programming/comments/3hufkw/the_handmade_manifesto

6391 0

付费图库集体封禁AI生成图片，网友躺赚版权费梦碎

1.4K1 0

【Rust日报】 2019-05-15：Rust 4周岁生日快乐！

官方评论：可能是最接近「Rust专用IDE」的IDE。 VSCode中使用Rust插件。好评比例比较多。 (Neo)vim使用Rust插件。喜欢VIM的人用吧，也够用了。 Sublime。...没啥评论。你推荐哪个？...Reddit 讨论 ---- cloud-hypervisor：一个在KVM上运行的开源虚拟机监视器（VMM） #intel #VMM intel又一个开源项目，目前还是实验性项目，基于rust-vmm...它强调了调试符号在调试中的重要性，以及如何在发送给客户之前拆分二进制文件....例如，40 GbE NIC可以比CPU访问其最后一级缓存（LLC）更快地接收缓存行大小的数据包，这使得操作系统跟上来自网络的数据包变得棘手。

8253 0

Mrkdown教程

+ 2005年创建Infogami，之后与Reddit合并成为其合伙人。...一级标题 ========= 二级标题 --------- 效果：一级标题二级标题 2）使用#，可表示1-6级标题。...若想在段内强制换行的方式是使用两个以上空格加上回车（引用中换行省略回车）。...若不在引用区块中，必须和前方段落之间存在空行。效果：第一项第二项第三项有序列表的标记方式是将上述的符号换成数字,并辅以.，如： 1 . 第一项 2 . 第二项 3 ....Markdown的使用者： + GitHub + 简书 + Stack Overflow + Apollo + Moodle + Reddit + 等等 6.

7303 0

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云