Loading [MathJax]/jax/output/CommonHTML/config.js
前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >禁止乱用:一款牛批的开源去马赛克工具。。。

禁止乱用:一款牛批的开源去马赛克工具。。。

作者头像
良月柒
发布于 2023-12-15 05:25:47
发布于 2023-12-15 05:25:47
4080
举报

阅读本文大概需要 2.8 分钟。

来自:开源最前线

如果你认为将密码或其他私密文本数据像素化就能保护它们不被窥见,那你真是太天真了,你的信息并没有你想象的那么安全。像素化(也称为马赛克)是一种常用的手段,可以大幅降低图像敏感区域的分辨率来隐藏信息。

近年来马赛克这项技术被广泛使用,但它的好日子已经不多了,最近一个新型的人工智能工具“Depix”横空出世,短短时间就在Github上标星 18.4K(Github地址:https://github.com/beurtschipper)

Depix的开发人员Sipke Mellema是一个信息安全顾问,他表示:“我见过一些公司把内部文件中的密码像素化,没有工具可以从这些图像中恢复密码,于是我创建了一个。”该工具适用于使用线性方框滤波器(linear box filter)创建的像素化图像。

# Depix的使用

要准备一个用于Depix处理的像素化文本序列,首先以单个矩形格式从截图图像中剪切相关的像素化块,然后将带有预期字符的De Bruijn序列粘贴到具有相同字体(文本大小、字体、颜色等)编辑器中。接下来,对序列进行截图,最好使用之前的序列截图,尽可能使用和像素化图像相同的截图工具。

最后,简单地运行 python depix.py -p [pixelated rectangle image] -s [search sequence image] -o output.png

恢复之后的效果和原图的对比结果:

但是,项目作者没有选择创建潜在字体的查找表,只是简单使用待处理字符的德布鲁因序列,将其粘贴到相同的编辑器中,然后截图。该截图可以用作相似 block 的查找图像,例如:

德布鲁因序列包括待处理字符的所有双字符组合。在以下测试图像中,Depix算法无法找到(o)的一部分。这是因为在搜索图像中,搜索block还包含下一个字母(「d」)的一部分,但在原始图像中这里有个空格。

不过对于大多数像素化的图像,Depix都可以找个单个的匹配结果,它假定这些都是正确的。然后将周围的多个匹配块匹配,然后再与马赛克图像相同的几何距离进行比较。这些匹配也被认为是正确的。

当正确的块没有更多的几何匹配后,它将直接输出所有正确的块。对于多匹配块,它输出所有匹配的平均值。它的输出还远远不够完美,但它的性能相当好。下图显示了一个带有随机字符的测试图像,大多数字符都可以正确破解出来。

Sipke Mellema还表示Depix技术类似于哈希破解,利用ECB的使用和已知明文攻击的使用。他建议人们对于敏感数据还是尽量不要用Depix。

链接:https://www.linkedin.com/pulse/recovering-passwords-from-pixelized-screenshots-sipke-mellema/

https://medium.com/syncedreview/depix-ai-recovers-pixelized-passwords-earns-10k-github-stars-d752915fac72

<END>

内容包含Java基础、JavaWeb、MySQL性能优化、JVM、锁、百万并发、消息队列、高性能缓存、反射、Spring全家桶原理、微服务、Zookeeper......等技术栈!

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2023-12-14,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 程序员的成长之路 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
Github高赞:给文字打马赛克=形同虚设,AI看透你一切小心思,已开源
---- 新智元报道   编辑:keyu 【新智元导读】继修复涂鸦图片之后,厚码文字也不再安全了?近日,名为Depix的Github项目火爆全网,一切故意而为之的“文字密码”,在这一AI技术的处理下,瞬间就“暴露于光天之下”。 “来P个图吧!” “好呀,不过这段话得打码,不然就麻烦了!” 如果现在告诉你,”打码“已经不再安全,你所想保护的信息,已然如”皇帝的新衣“,你会作何想? 不,这不是耸人听闻,最近一个名为Depix的GitHub项目火了,上线仅仅三天,star量就已经高达7K。截止发文,此项目已
新智元
2023/05/22
2.5K0
Github高赞:给文字打马赛克=形同虚设,AI看透你一切小心思,已开源
马赛克:就这?
像素化(又称马赛克)是一种常见的打码方式,通过降低图像中部分区域的分辨率来隐藏某些关键信息,比如:
Python进击者
2021/01/08
7700
马赛克:就这?
Depix:还原马赛克工具的试用及总结[通俗易懂]
一周前发现git上有个叫Depix的项目非常火,可以用来去除马赛克。 好奇之下准备下来试用一下这个工具 参考:
全栈程序员站长
2022/07/02
5.6K0
Depix:还原马赛克工具的试用及总结[通俗易懂]
马赛克还原神器—Depix,真的有那么神吗?「建议收藏」
第一步,作者在编辑器中使用了与原图(带有马赛克的图片)相同的字体设置(文本大小,字体,颜色等设置),然后将 debruinseq.txt 内的文字和数字放入编辑器中并截图,这张截图中的所有文字都将被像素化后作为“搜索集”来识别原图中马赛克的真实内容:
全栈程序员站长
2022/09/12
6.3K0
马赛克还原神器—Depix,真的有那么神吗?「建议收藏」
Github项目:AI消除马赛克实战
该算法利用线性盒滤波器分别处理每个块的事实。对于每个块,它将搜索图像中的所有块像素化以检查直接匹配。
不吃西红柿
2022/07/29
1.8K0
Github项目:AI消除马赛克实战
使用Depix进行马赛克的消除测试
最近看到各种公众号都在推一个叫Depix的Github项目,用途是能够消除文字马赛克,抱着试试看的态度测试了一下这个项目。
全栈程序员站长
2022/09/12
6.5K0
使用Depix进行马赛克的消除测试
GitHub标星7000+,快速恢复像素化图像,效果惊人
像素化(类似于马赛克)被许多领域用来加密图像中的重要信息, 例如很多公司会将内部文档中的密码像素化以加密数据,但之后并没有工具来恢复被像素化的图像。
AI科技大本营
2020/12/18
1.2K0
GitHub标星7000+,快速恢复像素化图像,效果惊人
GitHub高赞:给文字打马赛克=形同虚设,AI看透你一切小心思,已开源
点击上方蓝色“程序猿DD”,选择“设为星标” 回复“资源”获取独家整理的学习资料! 继修复涂鸦图片之后,厚码文字也不再安全了?近日,名为Depix的Github项目火爆全网,一切故意而为之的“文字密码”,在这一AI技术的处理下,瞬间就“暴露于光天之下”。 “来P个图吧!” “好呀,不过这段话得打码,不然就麻烦了!” 如果现在告诉你,”打码“已经不再安全,你所想保护的信息,已然如”皇帝的新衣“,你会作何想? 不,这不是耸人听闻,最近一个名为Depix的GitHub项目火了,上线仅仅三天,star量就已经高达
程序猿DD
2023/04/04
1K0
GitHub高赞:给文字打马赛克=形同虚设,AI看透你一切小心思,已开源
Depix 这款去“马赛克“工具效果如何?
最近突然冒出一则新闻,说出了一款开源去“马赛克“工具,三天获 Github 5000星,火爆网络!这款工具就是depix。
全栈程序员站长
2022/09/14
2.5K0
Depix 这款去“马赛克“工具效果如何?
22.8k stars打了马赛克就安全了吗?
该算法使用线性框滤波器单独处理每个块的事实。对于每个块,它都会像素化搜索图像中的所有块,以检查直接匹配项。
开源日记
2023/03/10
2850
22.8k stars打了马赛克就安全了吗?
提高驾驶技术:用GAN去除(爱情)动作片中的马赛克和衣服
作者:達聞西 量子位 已获授权编辑发布 作为一名久经片场的老司机,早就想写一些探讨驾驶技术的文章。这篇就介绍利用生成式对抗网络(GAN)的两个基本驾驶技能: 1) 去除(爱情)动作片中的马赛克 2)
量子位
2018/03/29
1.5K0
提高驾驶技术:用GAN去除(爱情)动作片中的马赛克和衣服
打满马赛克就安全?新技术已能够从像素化图像中还原文本信息
如今的图像处理技术,不仅能够将一张高度像素化(也就是打了马赛克)的图像复原,甚至能从中提取文本。
FB客服
2022/02/25
7410
打满马赛克就安全?新技术已能够从像素化图像中还原文本信息
技术老司机开车:用GAN去除(爱情)动作片中的马赛克和衣服!
作为一名久经片场的老司机,早就想写一些探讨“驾驶技术”的文章。这篇就介绍利用生成式对抗网络(GAN)的两个基本驾驶技能:
养码场
2018/08/13
4.4K0
马赛克密码破解——GitHub 热点速览 Vol.50
“xx”(爆粗口)这个词是最能体现本人看到本周 GitHub 热点的心情。那一天,看到用图片处理技术还原马赛克密码的 Depix 便惊为天人,这个本周特推的项目不负我望,一周轻松破万星。当然,也要提下眼前一亮的高颜值十六进制编辑器 ImHex,也是本周 GitHub Trending 的香馍馍,极搭逆向工程师。
HelloGitHub
2021/05/14
1.3K0
马赛克密码破解——GitHub 热点速览 Vol.50
高糊马赛克秒变高清,「脑补」面部细节,表情帝:这还是我吗?
杜克大学近期的一项研究可以将高糊人脸照片转换成清晰的面部图像,而且你完全看不出来图像中的人并非真人,而是计算机生成的人脸。
机器之心
2020/06/29
1.1K0
高糊马赛克秒变高清,「脑补」面部细节,表情帝:这还是我吗?
开源一款支持跨平台的截屏+OCR+搜索+翻译+贴图+以图搜图软件
国内快速下载链接:Releases · xushengfeng/eSearch · fastgit
开源日记
2023/03/10
2.6K0
开源一款支持跨平台的截屏+OCR+搜索+翻译+贴图+以图搜图软件
PyMuPDF 1.24.4 中文文档(十三)
从版本 1.4 开始,PDF 支持将任意文件作为 PDF 文档文件的一部分(“嵌入式文件流”)嵌入其中(参见章节“7.11.4 嵌入式文件流”,第 103 页的 Adobe PDF 参考手册)。
ApacheCN_飞龙
2024/06/21
1.4K0
YOLOPoint开源 | 新年YOLO依然坚挺,通过结合YOLOv5&SuperPoint,成就多任务SOTA
关键点通常是指Low-Level 的Landmark,如点、角点或边缘,它们可以从不同的视角轻松检索。这使得移动车辆能够估计其相对于周围环境的位置和方向,甚至可以使用一个或多个相机执行闭环(即同时定位与地图构建,SLAM)。在历史上,这项任务是通过手工设计的特征描述子来完成的,如ORB,SURF,HOG,SIFT。然而,这些方法要么不支持实时处理,要么在光照变化、运动模糊等干扰下表现不佳,或者检测到的关键点是聚集成簇而不是在图像中分散,这降低了姿态估计的准确性。学习到的特征描述子旨在解决这些问题,通常通过以随机亮度、模糊和对比度的形式进行数据增强。
集智书童公众号
2024/02/21
6760
YOLOPoint开源 | 新年YOLO依然坚挺,通过结合YOLOv5&SuperPoint,成就多任务SOTA
OpenCV3 和 Qt5 计算机视觉:6~10
它始终以未经处理的原始图像开始,这些图像是使用智能手机,网络摄像头,DSLR 相机,或者简而言之,是能够拍摄和记录图像数据的任何设备拍摄的。 但是,通常以清晰或模糊结束。 明亮,黑暗或平衡; 黑白或彩色; 以及同一图像数据的许多其他不同表示形式。 这可能是计算机视觉算法中的第一步(也是最重要的步骤之一),通常被称为图像处理(目前,让我们忘记一个事实,有时计算机视觉和图像处理可互换使用;这是历史专家的讨论。 当然,您可以在任何计算机视觉过程的中间或最后阶段进行图像处理,但是通常,用大多数现有设备记录的任何照片或视频首先都要经过某种图像处理算法。 这些算法中的某些仅用于转换图像格式,某些用于调整颜色,消除噪点,还有很多我们无法开始命名。 OpenCV 框架提供了大量功能来处理各种图像处理任务,例如图像过滤,几何变换,绘图,处理不同的色彩空间,图像直方图等,这将是本章的重点。
ApacheCN_飞龙
2023/04/27
2.8K0
EAST、PixelLink、TextBoxes++、DBNet、CRNN…你都掌握了吗?一文总结OCR必备经典模型(二)
本专栏将逐一盘点自然语言处理、计算机视觉等领域下的常见任务,并对在这些任务上取得过 SOTA 的经典模型逐一详解。前往 SOTA!模型资源站(sota.jiqizhixin.com)即可获取本文中包含的模型实现代码、预训练模型及 API 等资源。
机器之心
2023/08/08
1.3K0
EAST、PixelLink、TextBoxes++、DBNet、CRNN…你都掌握了吗?一文总结OCR必备经典模型(二)
推荐阅读
相关推荐
Github高赞:给文字打马赛克=形同虚设,AI看透你一切小心思,已开源
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档