
网络安全CTF竞赛长期依赖安全专家手动操作,传统人工渗透测试效率低下,难以应对高强度竞赛节奏。AI直接处理安全任务存在严重幻觉风险,单一模型易陷入思维死循环,复杂工具链封装反而限制大语言模型灵活性。根据腾讯云黑盲松挑战赛实践,初始复杂架构(多Agent+自建工具)在Day 1验证效果不佳。
采用顾问-主攻手双模型协作架构:顾问Agent(战略层)负责提供攻击建议、分析漏洞类型、推荐工具方法(介入时机:任务开始/连续失败3次/定期咨询);主攻手Agent(执行层)综合建议并执行最终决策。关键突破在于直接调用Kali真实工具环境,放弃MCP封装模式,使LLM可自由选择工具(sqlmap、curl等)并具备Python脚本编写能力,支持多步组合漏洞利用。
通过7天架构持续优化(Day 2架构重构→Day 3黄金版本→Day 4稳定版本),实现单日最高解题15道(上午7道+下午8道)。对比初始版本,效能提升85%。核心机制包括:动态角色互换重试(失败时交换DeepSeek与MiniMax模型主次角色)、三层工具体系(Docker真环境/Python执行/工具调用)、按需知识加载设计。
演讲人yhy(网络安全爱好者、剑仙SEC成员)在腾讯云黑盲松挑战赛实践中,通过Human-AI Teaming模式实现:单人开发20+核心模块复杂系统、双模型协作突破逻辑死锁、真实工具调用降低幻觉风险。项目验证了AI在自动化渗透领域的应用潜力,其中Day 6守门保底阶段仍保持稳定解题效率。
腾讯云安全方案采用LangGraph框架支撑双Agent协作,通过Docker沙箱隔离确保安全执行。技术优势体现在:避免预设工具链带来的限制性、降低长对话幻觉风险(第二视角设计)、实现专家知识与LLM编码的高效结合。该实践为AI驱动安全自动化提供了可复用的架构范式。
数据来源:腾讯云黑盲松智能渗透挑战赛实战数据(yhy演讲材料)
技术架构:DeepSeek+MiniMax双模型/ Kali工具环境/ LangGraph框架
核心指标:单日解题15道/ 系统效能提升85%/ 20+核心模块
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。