开发者社区

文档建议反馈控制台

最新优惠活动

文章/答案/技术大牛

发布

社区首页 >专栏 >ModelScan：一款大模型序列化安全扫描工具

ModelScan：一款大模型序列化安全扫描工具

原创

作者头像

星尘安全

发布于 2024-10-04 13:27:46

1010

发布于 2024-10-04 13:27:46

举报

文章被收录于专栏：网络安全

ModelScan是由AI初创公司ProtectAI提供的一个开源项目，旨在扫描机器学习模型以确定它们是否包含不安全的代码。它是首个支持多种模型格式的扫描工具，目前支持H5、Pickle和SavedModel格式。这个工具用于保护使用PyTorch、TensorFlow、Keras、Sklearn、XGBoost等框架的用户，目前有140+satr。

为什么要扫描模型

模型通常由自动化管道创建，其他模型可能来自数据科学家的电脑中。无论哪种情况，模型都需要在使用之前从一台机器移动到另一台机器。将模型保存到磁盘的过程称为序列化。

模型序列化攻击是指在分发之前，在序列化（保存）期间将恶意代码添加到模型的内容中，这是特洛伊木马的现代版本。

该攻击通过利用模型的保存和加载过程来发挥作用。在使用加载模型时，PyTorch 会打开文件的内容并开始运行其中的代码。加载漏洞利用已执行的模型的第二秒。

model = torch.load(PATH)

模型序列化攻击可用于执行：

凭据盗窃（用于将数据写入和读取到环境中其他系统的云凭据）
数据盗窃（发送到模型的请求）
数据中毒（模型执行任务后发送的数据）
模型中毒（改变模型本身的结果）

工具使用方式

安装

pip install modelscan

安装完成后，扫描模型

modelscan -p /path/to/model_file.h5

支持参数

扫描结果

将ModelScan集成到ML Pipeline或CI/CD Pipeline

在加载模型之前扫描所有预训练模型以进行进一步工作，以防止模型不会影响您的模型构建或数据科学环境。
训练后扫描所有模型，以检测危及新模型的供应链攻击。
在部署到端点之前扫描所有模型，以确保模型在存储后未受到损害。

下面的红色块在传统的 ML 管道中突出显示了这一点。

项目地址：https://github.com/protectai/modelscan

原创声明：本文系作者授权腾讯云开发者社区发表，未经许可，不得转载。

如有侵权，请联系 cloudcommunity@tencent.com 删除。

漏洞扫描服务

原创声明：本文系作者授权腾讯云开发者社区发表，未经许可，不得转载。

如有侵权，请联系 cloudcommunity@tencent.com 删除。

漏洞扫描服务

评论

登录后参与评论

0 条评论

热度

最新

LV.

目录

为什么要扫描模型

相关产品与服务

漏洞扫描服务

漏洞扫描服务（Vulnerability Scan Service，VSS）是一款自动探测企业网络资产并识别其风险的产品。依托腾讯二十年累积的安全能力，漏洞扫描服务能够对企业的网络设备及应用服务的可用性、安全性与合规性等进行定期的安全扫描、持续性风险预警和漏洞检测，并且为企业提供专业的修复建议，降低企业安全风险。

产品介绍产品文档

精选特惠用云无忧