要体验 SD3 Medium,可使用 Stability Platform(https://platform.stability.ai/)上的 API,注册 Stable Assistant(https...Reddit 用户使用 SD3 Medium 创建的 AI 生成图像,提示词为“一个人在客厅里打盹” Reddit 上的原帖题为《这个版本是来搞笑的吗?...随后发布的 SD 2.1 和 SD XL 成功扭转了局面,恢复了一部分因严格过滤 NSFW 内容而失去的绘图能力。...模型预训练期间可能出现的另一个问题,是研究人员设计的 NSFW 过滤器在删除数据集中成人图像时可能过于挑剔,意外排除了那些并不存在冒犯性的内容,这就导致模型偶尔无法准确描绘人体。...一位 Reddit 用户在帖子中写道,“只要图片不涉及人物,SD3 的工作就一切正常。所以我认为是他们用于过滤训练数据的 NSFW 过滤器敏感度过高,把所有人类图像都划入了 NSFW 范畴。”
几乎所有用户生成的内容,比如Yelp或TripAdvisor上的评论、Instagram和Facebook上的帖子、WhatsApp上的转发等等,所有内容的图片数量都在不断增加。...如果你的网站或者APP允许用户生成内容(UGC),例如评论、上传可能带图片的帖子等等。...各个API介绍 Microsoft image moderation 这个API将色情图像分类为“成人”或“猥琐”,我们将这两类都视为NSFW类。以下是一些错误地将安全图片分类为色情类的图片: ?...Clarifai nudity moderation 这个API返回一个NSFW/SFW类的置信度值。...该API将NSFW值大于或等于0.85的图像分类为NSFW, NSFW值小于或等于0.15的图像分类为SFW。而处于0.15到0.85范围之间的图像被视为未知状态(因为召回率非常低)。
今天我们就来学习用Keras构建模型,识别NSFW图片,俗称造个鉴黄AI。 ? 资源来自一名印度小哥Praneeth Bedapudi,涉及图像分类和目标检测两个科目。...不安全的nude图片来自三处: 一是用RipMe从website scrolller下载,这些图片来自Reddit论坛的各种NSFW板块; 图片来源:https://scrolller.com/nsfw...引入这些缩略图是为了平衡图片质量——上边的的Reddit图片质量太高了,而一个鉴黄AI,在现实中遇到的图片大多是渣品质,这就需要分辨率很低的缩略图来平衡。...for dropout add dropout between the fully connected layers and redefine the model using functional API...比如说见到一张NSFW图片,它就可以根据检测到的关键部位,自动遮挡: ? 预训练模型怎么用?
NSFW 是什么 NSFW 是一个英文网络用语,是 Not Safe For Work 或者 Not Suitable For Work 的缩写,意思是某个网络内容不适合上班时间浏览。...它通常被用于标记那些带有淫秽色情、暴力血腥、极端另类等内容的邮件、视频、博客、论坛帖子里等,以免读者不恰当的点击浏览。常见的用法是,在链接的后面,加上一对括号,括号中标记 NSFW。...restart=always \ -e TZ="Asia/Shanghai" \ -p 3000:3000 \ pengcheng820/nsfw-api...Asia/Shanghai" \ -p 3000:3000 \ registry.cn-shanghai.aliyuncs.com/pengcheng820/nsfw-api
发出这些视频的帖子中,博主还很礼貌地附上了一句「I'm sorry…」,评论表示,看完就后悔了。 ...更匪夷所思的还在下面—— 在Reddit的帖子上,网友甚至发出嘲笑般的质疑「这应该是个笑话吧?」...有Reddit用户认为,Stable Diffusion 3的解剖学失败是由于Stability坚持从训练数据中过滤掉成人内容(即NSFW内容,not suitable for work)。...因此,Stability AI 在SD 2.1和SD XL中迅速调整了策略,才让模型恢复了一些因坚决过滤NSFW内容而失去的能力。...对此,有网友猜测「(SD3)只要图片中没有人类就能正常工作,我认为他们改进的NSFW过滤器把所有类人形象都当成了NSFW。」
使用 Python 抓取 Reddit 在本文中,我们将了解如何使用Python来抓取Reddit,这里我们将使用Python的PRAW(Python Reddit API Wrapper)模块来抓取数据...Praw 是 Python Reddit API 包装器的缩写,它允许通过 Python 脚本使用 Reddit API。...用户名 password="") # 您的 reddit 密码 现在我们已经创建了一个实例,我们可以使用 Reddit 的 API 来提取数据。...抓取 Reddit 子 Reddit 从 Reddit 子版块中提取数据的方法有多种。Reddit 子版块中的帖子按热门、新、热门、争议等排序。您可以使用您选择的任何排序方法。...Reddit 帖子: 要从 Reddit 帖子中提取数据,我们需要帖子的 URL。
已解决:net.dean.jraw.http.NetworkException异常 一、分析问题背景 在使用JRAW(Java Reddit API Wrapper)开发与Reddit交互的应用时...该异常通常发生在尝试通过网络请求获取Reddit数据时,例如获取帖子列表或提交评论等操作。...场景:在一个Java应用中,开发者试图通过JRAW库从Reddit获取指定子版块(subreddit)的帖子列表。...API调用限制:Reddit对API调用频率有限制,超过限制会导致请求失败。 认证问题:OAuth认证失败或凭据无效。 服务器错误:Reddit服务器返回错误响应,如500内部服务器错误。...API调用频率限制:注意Reddit API的调用频率限制,避免因频率过高导致请求失败。 认证的正确性:确保OAuth认证凭据正确有效,避免因认证问题导致请求失败。
方法一: #复制下面的命令部署NSFW JS docker run -d -p 127.0.0.1:5000:5000/tcp \ --env PORT=5000 \ --restart=always...\ eugencepoi/nsfw_api:latest 注意:上面部署完毕后仅支持本地127.0.0.1访问,无法公开访问,如果您需要公开访问,请去掉127.0.0.1: 部署完毕后可以通过curl...url=图片地址" 如果成功会返回如下格式的json内容: { "score": 分数, "url": "图片地址" } score是图片得分,范围在0-1之间,1 表示它肯定是成人内容...nsfw vim docker-compose.yml 输入以下内容: version: '3' services: nsfw-api: image: penndu/nsfw-api:latest...restart: unless-stopped hostname: nsfw-api container_name: nsfw-api ports: - "
这回,Runway方面第一时间在HuggingFace的公告帖子做出了回应,而且还是创始人兼CEO本人下场: 他表示,Runway发布 Stable Diffusion 1.5 版本是没问题的,这是对我们创造...该公司的CIO Daniel Jeffries在reddit发帖,称正在研发新版本,并解释了为何不第一时间发布更新。 在《开源AI的未来为何比Stable Diffusion版本更新重要?...他表示,Stability AI筹划建立开源委员会,决定数据清洗、NSFW(工作场所不宜内容)、以及模型发布的正式指南等重大问题。...Reddit高赞评论质问:「你说采取措施保护人们不受伤害,具体措施到底指什么?要做到这点只有两条路:放弃开源或者进行限制,别无他法。」...参考资料: https://www.reddit.com/r/StableDiffusion/comments/y9ga5s/stability_ais_take_on_stable_diffusion
著名人工智能公司Clarifai近日推出了识别成人内容的模型和API NSFW,该模型能够很准确地识别含有裸体和半裸的图片和视频,在Clarifai的这篇博文中,作者用裸体检测问题来展示训练现代版的卷积神经网络模型...警告:本文内含有未打码的裸体图片,敬请注意! 早在1996年: ? 此领域的一项开创性工作是Fleck等人完成的一个项目,戏称为“寻找裸体人”。...')def batch_request(imgs, bboxes): """use the API to tag a batch of occulded images""" assert len...together""" bboxes = build_bboxes(img, boxsize=boxsize, stride=stride) print 'api calls needed:{}...a low stride will lead to thousands of API calls)boxsize= 64stride= 48blended, masks = get_nsfw_occlude_mask
后脚推特直接被搞崩,直至现在还有用户登不上…… 于是马斯克紧急限速三连:未经验证的用户只能浏览600个帖子。 结果非但没有解决问题,反倒直接把广大用户气炸。...“马斯克杀死了Twitter” 由于推特服务遭遇长期中断,过去几个小时内,推特用户们都见证了这神奇一幕: 根据用户不同等级,博文访问量被限制: 未验证用户每天只能看到600个帖子;要是新账户,只能看到...而另一边,同样是不想被白嫖数据的美国贴吧Reddit,付费API已经来了。 这直接导致了几个非常流行的第三方Reddit app下线。...还有的APP表示因为付费API的问题,之后他们将推出订阅模式,但会尽可能低价推出。 Apollo应用的创始人表示,之后他可能也会不太会使用Reddit了。...今年4月,Reddit宣布对接入API的公司开始收费,其CEO曾表示: Reddit的数据库真的很有价值。但是我们不想将这些有价值的内容免费提供给科技大公司。
引言Reddit,作为一个全球性的社交平台,拥有海量的用户生成内容,其中包括大量的图片资源。...Reddit的热门图片通常可以在其首页的热门帖子中找到。1. 设置代理和User-Agent为了模拟浏览器行为并避免被网站屏蔽,我们需要设置User-Agent,并可能需要设置代理服务器。...def get_reddit_hot(): url = "https://www.reddit.com/r/pics/hot.json" # 访问热门图片板块的JSON API response...= session.get(url) response.raise_for_status() # 确保请求成功 return response.json() # 返回JSON格式的数据...解析JSON响应Reddit的热门图片板块提供了JSON格式的API,我们可以从中提取图片链接。
Reddit,作为全球最大的社区平台之一,以其丰富的用户生成内容、广泛的讨论话题和实时的信息更新吸引了大量用户。...对于研究人员和开发者而言,Reddit提供了宝贵的数据源,可用于文本分析、舆情监控和趋势研究等多个领域。然而,由于Reddit的内容实时更新频繁、用户互动活跃,直接爬取其数据面临诸多挑战。...} }; // 创建Request对象,设置GET请求 var request = new RestRequest("api...提取帖子标题、得分和评论数,并进行统计分析。...输出部分帖子标题及统计结果,包括帖子数量、平均得分和平均评论数结论通过本文的技术分析和代码实现,展示了如何使用C#和RestSharp库,结合代理IP和多线程技术,实现高效的Reddit内容爬取。
为了展示 Cheerio 的强大功能,我们将尝试在 Reddit 中抓取 r/programming 论坛,尝试获取帖子名称列表。...这将得到所有帖子,因为你只希望单独获取每个帖子的标题,所以必须遍历每个帖子,这些操作是在 each() 函数的帮助下完成的。...为了演示如何用 JSDOM 与网站进行交互,我们将获得 Reddit r/programming 论坛的第一篇帖子并对其进行投票,然后验证该帖子是否已被投票。...如果存在于 classList 中,则返回一条消息。 打开终端并运行 node crawler.js,然后会看到一个整洁的字符串,该字符串将表明帖子是否被赞过。...它通过为开发人员提供高级 API 来默认控制无头版本的 Chrome。 ?
以Reddit为例,主页上有很多帖子。所有的信息杂乱都很难跟踪。...这些Reddit帖子显示了一个论坛可能会在几天不活动的情况下带来多大的混乱 在本文中,将更多地了解如何从Reddit等论坛中提取信息更容易,更直观。...Reddit Code获得某个subreddit频道 接下来使用以下元数据将hot_python导出到topics.csv 从Reddit Praw中提取帖子后检索的元数据 主题提取 本节说明如何在...等主题建模技术的详细信息如下: https://www.aclweb.org/anthology/D12-1087 使用sklearn Count Vectorizer来矢量化单词 这将在topics.csv中的1115个帖子中返回...此外下表将根据所选主题展示最相关的帖子。因此用户可以快速浏览一下此仪表板,而不是点击所有可用帖子,以便了解讨论情况。 只需点击几下即可过滤相关帖子。
如何使用 NSFW.JS?...Classify the image const predictions = await model.classify(img) console.log('Predictions: ', predictions) API...const model = nsfwjs.load('/path/to/model/directory/') 参数 可选的 URL model.json 返回 准备使用 NSFWJS 模型对象 对图像进行分类...此函数可以使用任何基于浏览器的图像元素(,),并返回最可能的预测数组及其置信度。...(默认全部都是 5) 返回 对象数组包含 className 和 probability。
欢迎指正错误~ 我们想要更好的向用户展示 Reddit 的规模。为了这一点,投票和评论数是一个帖子最重要的指标。然而,在 Reddit 上有相当多的用户只浏览内容,既不投票也不评论。...4、Reddit 是全球访问量第八的网站,系统要能在生产环境的规模上正常运行,仅允许几秒的延迟。 要全部满足以上四个需求的困难远远比听上去大的多。...我们认为 Redis 中 HLLs 的实现文档齐全、容易配置,提供的相关 API 也很容易集成。还有一个好处是,我们可以用一台专门的服务器部署,从而减轻性能上的压力。 ?...Reddit 的数据管道依赖于 Kafka。当一个用户访问了一篇博客,会触发一个事件,事件会被发送到事件收集服务器,并被持久化在 Kafka 中。 之后,计数系统会依次顺序运行两个组件。...总 结 我们希望浏览量可以让发帖者了解帖子全部的访问量,也帮助版主快速定位自己社区中高访问量的帖子。在未来,我们计划利用我们数据管道在实时方面的潜力来为 Reddit 的用户提供更多的有用的反馈。
下面是通过我们的API重新生成这些结果的代码片段: # NSFW occlusion experiment fromStringIOimportStringIO importmatplotlib.pyplotasplt...') defbatch_request(imgs, bboxes): """use the API to tag a batch of occulded images""" assertlen(bboxes...(img, boxsize=64, stride=25): """generatebboxes and occluded images, call the API, blend the results...a low stride will lead to thousands of API calls) boxsize=64 stride=48 blended, masks =get_nsfw_occlude_mask...【……】 这个过程类似于返回一个强烈的激活的属性(而不是普通的梯度),即,用强烈激活计算 ,其中Xn 是特征映射的元素, 输入图像的位置。
并且点赞数和帖子新旧程度的权衡可以通过G的大小来调整。但仍然有几个未解问题: 时间衰减过快,对于一些有长实效性的打分并不适用。能否在打分上加入指数? 如何考虑时间衰减和当前时段的关系。...点赞率高的应该考虑排在前面,但同样浏览量过小的点赞率也要考虑置信度的问题 Reddit Hot Formula - 包括点赞和拍砖 ?...同时考虑点赞和拍砖,Reddit 的 Hot Formula采用了和Hacker News相似的打分方式,来推荐优质高热度的文章。并针对上述问题(1)和(3)给出了不同的处理。...思考:时间衰减 比较Hacker News,和Reddit Hot Formula, 主要的两点区别在于对点赞量(拍砖)取log进行压缩,以及不同的时间衰减项。...简单来说时间衰减的意义就是为了让新老文章的热度具有可比性,否则老的帖子会因为在更长的时间累计了更多的帖子而始终置顶。一种直观的解决办法就是给老的帖子增加时间惩罚项。