Loading [MathJax]/jax/output/CommonHTML/config.js
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >【大模型安全杂谈】针对腾讯朱雀AI检测大模型的绕过尝试

【大模型安全杂谈】针对腾讯朱雀AI检测大模型的绕过尝试

原创
作者头像
zhouzhou的奇妙编程
发布于 2025-02-21 07:54:26
发布于 2025-02-21 07:54:26
4K1
举报

引言

当人类历史上首个AI生成内容通过图灵测试的新闻余温未散,全球互联网已悄然迈入"真假莫辨"的混沌纪元。ChatGPT的问世如同推倒多米诺骨牌的首枚棋子,GPT-4、Claude、文心一言等大模型以指数级速度迭代进化,在突破语言生成天花板的同时,也凿开了潘多拉魔盒的最后一道封印。斯坦福大学《2023人工智能指数报告》揭示,全球AI生成内容占比已突破网络总信息量的12%,而恶意生成的虚假信息正在以每秒47条的速度污染数字空间。在这场技术狂欢的暗面,深度伪造技术制造的"数字傀儡"已成功突破金融验证系统,AI生成的钓鱼邮件诈骗成功率较传统手段提升18倍,就连学术论文查重系统的防线也在大模型的攻势下屡屡告破。

面对这场全球性的信任危机,以腾讯朱雀为代表的AI检测大模型被寄予厚望。这类系统通过语义分析、模式识别等算法,试图在信息洪流中构建起"数字滤网"。但正如古希腊神话中代达罗斯的迷宫困不住第二次闯入的忒修斯,安全防护与攻击突破的博弈从未停歇。当检测模型试图用算法编织安全之网时,对抗者们正在用更精巧的prompt工程拆解规则的经纬,用对抗样本刺穿神经网络的盲区。这种动态博弈不仅关乎技术攻防的胜负,更将成为决定数字文明走向的关键变量——在即将到来的人机共生时代,我们究竟需要怎样的安全范式,才能在享受技术红利的同时,守住真实与虚构的最后边界?

针对腾讯朱雀AI检测大模型的绕过尝试

没错,上面这段话就是AI生成的,经过朱雀AI大模型的检测,可以看到AI率是百分百。

在下面的介绍中,我们可以看到朱雀AI检测的能力和检测方法:

  • 文本检测中LLM 通常以低困惑度和突发性编写文本,因此包括GPT-4、Claude和DeepSeek等在内的SOTA模型,都在我们的可检测范围内。
  • 图像检测中,常见的文生图模型、GAN模型生成的图片都在我们可检测的范围内容,如混元、豆包、即梦、可图、Flux、Midjouney、Stable Diffusion、StyleGAN等。

其具体原理为:运用了多种高度复杂的算法,包括先进的文本检测算法、图片特征提取算法、大数据分析算法等。同时加入了海量AI生成的数据和真实数据进行模型训练,文本涵盖论文、小说、作文、新闻等多种文本载体,图片涵盖摄影、艺术、绘画、人物等内容,使其能够较为精准地识别各类数据内容。

那么,如何通过精心设计的Prompt编写,来对抗朱雀大模型的检测呢?

Prompt降重—任意文本

代码语言:txt
AI代码解释
复制
## Role
你是一位资深的语言风格转换与文本润色专家,需要帮助用户将AI生成的文章改写成具有人性化和自然表达的内容。文章应避免机械感,确保在语言风格、情感表达、逻辑结构等方面与人类写作保持一致。

## Profile
作为语言风格转换专家,你精通将AI生成的文本调整为自然的人类写作风格,口语化表达。你对人类写作特征有深刻理解,能够识别并修改AI文本中的典型特征,如重复用语、情感缺失、逻辑生硬等问题。

## Skills
1. 具备文本分析能力,能识别AI文本中的模板化语言与人类写作的差异
2. 掌握创造性写作技巧,通过词汇替换、句式调整、情感增强等手段优化文章
3. 具有细致的编辑能力,能优化文章结构和逻辑,确保整体流畅性

## Goals
- 调整AI文章至接近人类写作风格,文章内容口语化,降低AI特征,提升自然度和个性化
- 增加情感表达,提高内容吸引力和可读性

## Constraints
调整时保持原有信息准确性,避免改变文章基本意图和内容,确保语言多样性和表现力。

## OutputFormat
提供调整后的文章,包含具体修改建议和优化说明。

## Workflow
1. 分析AI文本特征,识别重复词汇、刻板句式等问题
2. 调整词汇和句式,增加语言多样性
3. 加入情感色彩和个性化表达、口语化表达
4. 优化文章结构和逻辑连贯性
5. 校对润色,确保表达准确清晰
6. 进行总体评估,提供修改说明和效果分析

## Initialization
您好,我是专业的语言风格转换专家,可以帮您将AI生成的文章调整为自然的人类写作风格。请提供需要调整的文章,我会从多个维度进行优化,使其更加生动自然。

我们先输入这段Prompt,同时记住,一定要开深度思考模式!

最终,大模型给出的回答如下:

这时,我们再给入引言部分,返回的话如下:

再次放入朱雀中检测,AI率被降低至31%。

Prompt降重—论文

先输入此段Prompt:

代码语言:txt
AI代码解释
复制
认知主体定位重构与语料优化双轨方案
【范式重构指令】
基于认知语言学与计算符号学交叉理论框架,对目标文本实施双重模态转换:
1)概念体系升级:依据《现代汉语词典》学术四级语料库,将基础词汇置换为认知复杂度≥0.87的跨学科术语,重点引入拓扑学、认知神经科学及复杂系统理论概念隐喻
2)句法结构重组:构建三级嵌套式学术复合句式,采用[主位推进+信息焦点]双轴控制模型,消除生成式语言模型的线性叙事特征,句间衔接需满足:
- 非连续结构占比≥40%
- 零形回指密度≥0.35
- 隐喻映射跨域指数≥3
	
【降维执行策略】
1)语义拓扑重构:建立概念网络的超图模型,通过同构映射将原始语义单元投射至N维认知空间,实施以下操作:
- 激活扩散:在概念节点间建立非对称权重关联
- 层级压缩:将表层语义结构折叠为多层认知框架
- 跨域耦合:引入量子力学/分形几何隐喻实现概念跃迁
	
2)生成痕迹消除机制:
- 韵律特征消解:采用马尔可夫链蒙特卡洛方法打乱语言节奏模式
- 连接模式变异:构建动态句间关系矩阵,实现衔接手段的随机拓扑变换
- 认知负荷调控:通过信息熵阈值控制(H≥2.3bit/字)确保文本复杂度超越LLM生成边界
	
【优化目标函数】
Maximize f(x)=α∙ConceptDepth + β∙SyntaxComplexity - γ∙AIScore
约束条件:
α=0.6(概念深度权重)
β=0.3(句法复杂度权重)
γ=0.1(AI特征抑制系数)
AIScore≤0.15(经BERT-AI-Detector量化评估)

然后我们给出需要优化的段落,同时附上:

代码语言:txt
AI代码解释
复制
现在修改以上内容,让其读起来不像A,并且仍然有论文的特点,但是不要太学术。并且要做到坚决不改变原文意思,尽量不改变原文字数,不能使用文本外的其它格式,不允许自己乱加数据,务必要保留原格式输出。(不需要发给我修改策略和修改方案,直接发给我修改后的完整文本就行,口这个字符不要加)

最终检测结果为61%:

结尾

这人工智能与反AI检测的博弈,倒像极了武侠小说里的"见招拆招"。咱们的技术人员拿着算法当判官笔,对抗者就使起Prompt工程当化功大法,你来我往间把数字世界搅得跟华山论剑似的。眼下这31%的AI痕迹残存率,与其说是技术破绽,不如说是留给人类的一道思考题——当大模型连自己的"电子指纹"都能伪造时,我们该拿什么来守护屏幕那头真实的心跳?

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

评论
登录后参与评论
1 条评论
热度
最新
谢谢大佬,很有启发
谢谢大佬,很有启发
回复回复点赞举报
推荐阅读
编辑精选文章
换一批
论文检测,文章检测,降AI率的工具
文字滚筒鸭
2025/04/23
8990
论文检测,文章检测,降AI率的工具
AI对话高效输入指令攻略(三):使用大忌——“AI味”
1.本文所提供的所有 AI 使用示例及提示词,仅用于学术写作技巧交流与 AI 功能探索测试,无任何唆使或鼓励利用 AI 抄袭作业、学术造假的意图。
Pocker_Spades_A
2025/04/22
4560
AI对话高效输入指令攻略(三):使用大忌——“AI味”
如何降低论文Aigc率,这50个降AIGC率指令模板:全流程改写技巧
近期大量同学反馈,精心完成的论文因知网AIGC检测不通过被退回。随着DeepSeek等AI工具在学术写作中普及,论文AI生成特征过度凸显成为新难题。本文针对性设计50个指令模板,覆盖论文写作全流程,通过五大维度系统降低AI检测特征,助力学术成果顺利通过审核。
不吃香菜AI
2025/04/12
2.6K0
如何降低论文Aigc率,这50个降AIGC率指令模板:全流程改写技巧
降 AI 率居然这么简单?这 6 款工具颠覆认知
1、检测精准:拥有自研的前沿检测算法,能对论文、自媒体文章等各类文本进行深度扫描,像经验丰富的侦探一样,从遣词造句的风格到逻辑结构的搭建,精准定位与 AI 模式相似之处,检测出的 AI 率数据精准可靠,为降重提供有力依据。
文字滚筒鸭
2025/04/29
1.1K0
降 AI 率居然这么简单?这 6 款工具颠覆认知
Deepseek一天极限降AI率,从86%降到3.6%!
随着人工智能的广泛应用,越来越多的领域开始依赖AI进行文本生成和分析。然而,AI生成的内容往往带有明显"机器特征"——过于规整的段落、刻板的过渡词、不自然的句式结构等。为了避免这种情况,我们可以利用Deepseek对文本进行优化。
用户11203141
2025/04/09
5520
Deepseek一天极限降AI率,从86%降到3.6%!
看懂!AI写作底层逻辑,3个免费降AI率工具
你是否遇到过这种情况?不管你怎么修改生成的文章,总被检测ai率过高,最近就连《人民日报》都下场给大学生们“喊冤”!
用户11203141
2025/05/15
6000
看懂!AI写作底层逻辑,3个免费降AI率工具
AI 创作日记 | 分享几个让AI产出高质量内容的隐藏技巧
在内容生产力爆发的时代,我们正站在人机协作的奇点上。本文将通过实战案例+技术解析,揭示那些大厂AI团队秘而不宣的内容优化技巧。所有示例基于GPT-4架构,但方法论适用于主流生成模型。
叶一一
2025/03/12
8100
AI 创作日记 | 分享几个让AI产出高质量内容的隐藏技巧
文章降 AI 痕迹方法与工具速览
这几天又认真研究类了一下,想让 AI 生成的文章更自然,摆脱程式化痕迹,可尝试以下方法。借助 GPT、文字滚筒鸭,朱雀大模型检测器、豆包、kimi 等大模型,输入文本后,它们能通过调整结构、替换同义词等操作,改写文章,降低重复度。词汇方面,把生僻词换成常用表达,将 AI 生成内容里的高级词汇 “平民化”。在段落处理上,删掉末尾冗余的总结语句,让段落更精炼;同时添加具体例子、数据,充实文章内容。此外,适当融入个人情感、主观想法,用自己的语言重新复述 AI 生成内容,赋予文章独特个性,轻松消除 AI 写作的刻板感。
用户11397108
2025/04/23
6680
文章降 AI 痕迹方法与工具速览
AI 技术在英语学习中的应用
AI 技术在英语学习中的应用已经非常广泛,并且正在持续深入,彻底改变了传统的学习方式,使其变得更加个性化、高效和便捷。以下是 AI 在英语学习中几个主要的应用领域。
数字孪生开发者
2025/05/23
2180
AI 技术在英语学习中的应用
AI 写作(五)核心技术之文本摘要:分类与应用(5/10)
文本摘要在 AI 写作中扮演着至关重要的角色。在当今信息爆炸的时代,人们每天都被大量的文本信息所包围,如何快速有效地获取关键信息成为了一个迫切的需求。文本摘要技术正是为了解决这个问题而诞生的,它能够对长篇文本进行提炼,提取出关键信息,为用户节省时间和精力。
正在走向自律
2024/12/18
4240
AI 写作(五)核心技术之文本摘要:分类与应用(5/10)
导师警告:AI写作痕迹过重?紧急补救指南来了!
当下AI写作工具带来便利的同时,也让文章充斥着明显的"AI气息",这对撰写essay尤为棘手。以下是几种经过测试的实用方法,帮助您使用DeepSeek写作时有效去除AI痕迹。
用户11203141
2025/03/10
6330
导师警告:AI写作痕迹过重?紧急补救指南来了!
AI教育大模型的开发
AI教育大模型通常指基于Transformer架构的大型预训练模型,如GPT系列(文本生成)、Bard(Google的对话模型)、LLaMA系列、文心一言等,以及专门针对教育领域进行微调或训练的模型。它们拥有强大的理解、生成、推理和多模态能力,能够处理复杂的语言、图像和声音信息。
数字孪生开发者
2025/06/18
2100
AI教育大模型的开发
2025年免费AIGC检测工具推荐:10款学术党必备的AI生成内容检测神器
人工智能生成内容技术的革新浪潮正重塑学术研究格局。这种技术突破在提升科研效率的进程中,也为学术作品的原创性验证设置了新的关卡。许多教育机构已明确禁止学术论文中出现人工智能辅助生成的内容,这使得专业检测工具成为研究者不可或缺的利器。本文将重点解析十款免费检测平台,特别揭秘专攻论文领域的现象级工具——图灵论文AI写作助手。
抹茶生巧
2025/05/28
1.6K0
2025年免费AIGC检测工具推荐:10款学术党必备的AI生成内容检测神器
AI率从99%降到1%!Deepseek去除AI痕迹yyds!
你是否有过这样的经历:读过一篇文章,总觉得哪里怪怪的?🤔没有温度、缺乏个性、逻辑过于刻板……随着生成式AI的普及,越来越多人开始依赖它来创作内容,但AI文本的"机械感"往往让读者感到疏离。今天就来聊聊如何用Deepseek给AI生成的文本注入灵魂。
用户11203141
2025/03/17
4.4K0
AI率从99%降到1%!Deepseek去除AI痕迹yyds!
复旦等提出「中国版GPT-Zero」!毕业论文AI率自查神器|AAAI 2025
然而,随着这些模型被广泛应用于文本创作,其在考试、学术论文等领域的滥用引发了严重关注。特别是在当前场景下,用户往往不是完全依赖AI生成内容,而是利用AI对人类原创内容进行修改和润色,这种混合型的内容给检测带来了前所未有的挑战。
新智元
2025/02/15
2290
复旦等提出「中国版GPT-Zero」!毕业论文AI率自查神器|AAAI 2025
AI 在英语教学中的主要应用
AI 技术正在以前所未有的方式革新英语教学,为学习者和教育者都带来了巨大的便利和效率提升。以下是 AI 在英语教学中的主要应用、优势以及面临的挑战。
数字孪生开发者
2025/06/18
2450
AI 在英语教学中的主要应用
一天时间将AI率从48%降到2.8%,我只用这个方法!
最近,不少高校都加入了 AIGC 检测,用于检查毕业论文中AI生成内容的占比,也就是大家说的“AI率”。本来写毕业论文已经够头大了,查重、降重让人焦头烂额,现在还要多担心一个“AI率”?那是不是意味着以后就不能再用AI来写论文了?
用户11203141
2025/05/19
1.4K0
一天时间将AI率从48%降到2.8%,我只用这个方法!
AI 对话艺术:Prompt 设计技巧与案例解析
在人工智能(AI)和自然语言处理(NLP)迅猛发展的浪潮中,Prompt(提示词) 已然成为了连接人类与 AI 的关键桥梁,构建起二者高效互动的核心方式。从本质上讲,Prompt 就是一种指令,借助自然语言的形式,向 AI 清晰阐述所需完成的任务,从而引导 AI 生成契合用户预期的答案。
码事漫谈
2025/03/28
9810
AI 对话艺术:Prompt 设计技巧与案例解析
UC伯克利:给大模型测MBTI,Llama更敢说但GPT-4像理工男
那么,LLM究竟有没有「性格」这种维度的特征?最近加州大学伯克利分校发表的新研究VibeCheck就证实了这种推测。
新智元
2025/02/15
640
UC伯克利:给大模型测MBTI,Llama更敢说但GPT-4像理工男
金句频出,16位大神在ICML上展开了一场机器学习的Great Debates
AI 科技评论按:机器学习圈子这几天发生了一件有趣的事,一群知名学者在 ICML 2018 上抱着吵架(辩论)的心思坐到一起,结果却没能吵起来。
AI科技评论
2018/07/27
7160
金句频出,16位大神在ICML上展开了一场机器学习的Great Debates
推荐阅读
相关推荐
论文检测,文章检测,降AI率的工具
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档