前提条件
注意:
操作步骤
步骤1:进入数据检索页面
支持以下两种方式:
登录 文件存储控制台,在左侧导航栏中,选择数据管理 > 数据检索,进入检索策略列表页。
登录 文件存储控制台,单击文件系统 ID,进入文件系统详情页,选择数据检索标签页,可以查看该文件系统下的策略。
步骤2:创建检索策略
1. 在数据检索列表页面,单击新建检索策略。
2. 在弹出的对话框中,配置基本信息:
检索名称:策略的名称,最多60个字符。建议填写业务含义明确的名称
文件系统 ID:选择需要进行数据检索的目标文件系统。从文件系统详情页进入会默认展示对应文件系统,无需选择。
3. 选择任务类型。至少勾选以下一种:
聚合统计(默认勾选):统计文件数量、文件容量、目录数量等汇总信息。适合快速了解存储概况。
数据清单:生成符合检索条件的文件/目录清单,支持下载。适合需要获取具体文件列表的场景。
4. 配置检索条件。系统提供两种方式设置检索条件:
通过可视化界面添加筛选条件,无需手写 SQL,适合快速上手。多个条件之间可选择 AND(同时满足)或 OR(满足任意一个)逻辑关系,每个条件支持复制和删除操作。系统会实时展示对应生成的 SQL 语句,方便学习和参考。具体条件类型如下:
条件类型 | 说明 |
文件大小 | 设置文件大小范围(支持 KiB/MiB/GiB 单位) |
目录路径 | 限定检索的目录前缀,需以 /cfs/ 开头、* 结尾 |
最后访问时间 | 支持绝对时间(精确日期)和相对时间(如近30天) |
数据冷热状态 | 按冷数据/热数据筛选 |
文件后缀 | 按文件扩展名筛选,需以 * 开头 |
示例1:查找冷数据
添加以下检索条件:
条件类型:选择数据冷热状态。
冷热状态:选择热数据。
系统自动生成对应的 SQL 语句,您无需手动编写。

示例2:查找指定目录下的大文件
添加以下检索条件:
1. 条件1:
条件类型:选择文件大小。
大小范围:设置为
1,单位选择 GiB(即大于 1 GiB)。2. 单击+ 添加检索条件,添加条件2:
条件类型:选择目录路径。
目录路径:填写
/cfs/data/*。3. 两个条件的逻辑关系保持为且(AND),组合后的查询条件为:目录路径 =
/cfs/data/* AND 文件大小 > 1GiB。
示例3:查找最近访问且后缀为 .log 的日志文件
添加以下检索条件:
1. 条件1:
条件类型:选择最后访问时间。
最后访问时间:选择相对时间,近设置为
90,单位选择天(即近90天以内)。2. 单击+ 添加检索条件,添加条件2:
条件类型:选择文件后缀。
文件后缀:填写
*.log(按文件扩展名筛选,需以 * 开头)。3. 两个条件的逻辑关系保持为且(AND),组合后的查询条件为:最后访问时间 90 天以内 AND 文件后缀 =
*.log。
5. (可选)设置定期执行。如需自动定期执行,勾选定期执行周期并配置。
周期:选择按周(选择星期几)或按月(选择几号)。
日期:按周时选择星期,按月时输入日期(1 - 31)。
执行时间:选择每天的执行时间点(可多选小时)。所选时间点将整点触发,每个被勾选的小时都会独立执行一次检索任务。例如同时勾选02:00、11:00、14:00、21:00,则每天02:00、11:00、14:00、21:00各执行一次。
执行时长:首次检索任务为全量扫描,后续扫描为增量扫描,执行时长取决于文件数据量,通常在 5 分钟以内。
6. 单击保存策略。
步骤3:执行检索任务
注意:
数据检索采用首次全量扫描,后续增量扫描来加速检索效率,因此首次执行检索任务时间可能较长,请您耐心等待。
1. 在检索策略列表页,找到目标策略。
2. 在列表页操作栏,单击手动执行。您也可以进入策略详情页,单击右上角的手动执行。
3. 系统将立即创建并执行一次检索任务,自动跳转到策略详情页,您可以在详情页查看执行结果。
如果在创建策略时配置了定期执行周期,系统会按照设定的时间自动触发,无需手动干预。
步骤4:查看任务结果
1. 在检索策略列表页,单击目标策略 ID,进入策略详情页。
2. 在任务执行记录列表中,查看任务执行情况:
字段 | 说明 |
任务 ID | 每次执行的唯一标识。 |
状态 | 排队中 / 执行中 / 执行成功 / 执行失败。鼠标悬停在状态为执行失败的任务上,可查看具体错误信息。 |
文件数量 | 符合条件的文件总数(任务成功后显示)。 |
文件容量 | 符合条件的文件总容量(任务成功后显示)。 |
目录数量 | 符合条件的目录总数(任务成功后显示)。 |
创建时间 | 任务触发时间。 |
文件清单 | 数据清单结果下载链接(有效期7天,请及时下载),超期后需重新执行任务获取。 |

管理检索策略
编辑检索策略
1. 在 数据检索列表页,找到目标策略。
2. 在操作列,单击编辑。
3. 在弹出的对话框中,修改检索名称、检索条件或定期执行周期。
4. 单击保存策略。
注意:
文件系统 ID 不可修改。 如需更换目标文件系统,请直接新建一条检索策略。
修改后无法回滚。 系统不保留修改前的策略详情,请谨慎操作。
若修改时间晚于检索任务的实际执行时间,建议您重新执行该任务,以确保检索结果基于最新的策略生成。
删除检索策略
1. 在 数据检索列表页,找到目标策略。
2. 在操作列,单击删除。
3. 在弹出的确认对话框中单击确定。
注意:
删除策略后,历史任务记录同步清除,请谨慎操作。
搜索与筛选
搜索维度 | 说明 |
数据检索策略 ID | 输入策略 ID(格式为 dataretrieval-xxxxxxxx)精确搜索。 |
数据检索名称 | 输入策略名称关键词模糊搜索。 |
文件系统 ID | 输入关联的文件系统 ID 查找。 |
SQL 参考指南
本节详细介绍数据检索中使用的两种 SQL 语法。如果您是首次使用,建议先通过条件生成器熟悉基本用法,再逐步学习 SQL 模式。
聚合统计 SQL 语句
聚合统计 SQL 用于对文件系统中的文件进行汇总统计。
基本结构
from entries | where <筛选条件> | stats <统计指标>
关键字与参数说明
关键字/参数 | 含义 | 说明 |
from entries | 数据源 | 固定写法,表示从文件系统的文件条目中检索,不可更改 |
where | 筛选条件 | 类似 SQL 的 WHERE,用于过滤符合条件的文件 |
stats | 统计输出 | 类似 SQL 的 SELECT + GROUP BY,定义要输出的统计指标 |
size | 文件大小 | 文件的字节大小,可配合 >、<、>=、<= 使用 |
path | 文件路径 | 文件的完整路径,默认需以 /cfs/ 为路径前缀 |
type | 条目类型 | 取值 "file"(文件)或 "directory"(目录) |
hsm_status | 冷热状态 | 取值 "new"(热数据)或 "released"(冷数据) |
sum() | 求和函数 | 对指定字段求和,如 sum(size) 表示总容量 |
count() | 计数函数 | 对指定字段计数,如 count(path) 表示条目数 |
统计指标写法
在
stats 子句中,统计指标的格式如下,多个统计指标之间用逗号分隔。stats 别名1=聚合函数1(字段) where <筛选条件1>, 别名2=聚合函数2(字段) where <筛选条件2>
示例
示例1:统计所有文件的容量和数量
from entries |where path like "/cfs/*" |stats totalsize=sum(size),filenum=count(path) where type=="file",dirnum=count(path) where type=="directory"
示例2:查找大于1GiB 的大文件并统计
from entries |where path like "/cfs/*" AND size >= 1073741824 |stats totalsize=sum(size),filenum=count(path) where type=="file",dirnum=count(path) where type=="directory"
说明:
查询语句中文件大小以字节(B)为单位。常用换算:1KiB = 1024B,1MiB = 1048576B,1GiB = 1073741824B,1TiB = 1099511627776B。
示例3:按路径前缀筛选并统计
from entries |where path like "/cfs/test/*" |stats totalsize=sum(size),filenum=count(path) where type=="file",dirnum=count(path) where type=="directory"
数据清单查询语句
数据清单查询语句用于筛选文件并生成文件列表下载。
基本格式
字段名:操作符值 AND/OR 字段名:操作符值
字段与操作符说明
字段 | 含义 | 示例 |
path | 文件路径,可用于模糊匹配文件后缀 | path:/cfs/subdir/* path:*.dat |
size | 文件大小(单位 B,字节) | size:>=104857600 AND size:<10737418240 |
atime | 最后访问时间 | 相对时间:atime:>now-1d 绝对时间:atime:[* TO "2026-06-18T16:00:00.000Z"} |
hsm_status | 数据冷热状态。 new:热数据 released:冷数据 | hsm_status:new hsm_status:released |
逻辑连接符
连接符 | 含义 |
AND | 同时满足所有条件 |
OR | 满足任一条件 |
示例
示例1:查找指定路径下大于1GiB 的文件
path:/cfs/test/* AND size:>=1073741824
示例2:查找日志文件或临时文件
path:*.log OR path:*.tmp
示例3:查找指定路径下大于1GiB 且状态为冷数据的大文件
path:/cfs/test/* AND hsm_status:released AND size:>=1073741824
常见单位换算速查
在 SQL 中文件大小以字节为单位,以下为常用换算,进制为1024。
单位 | 字节数 |
1 KiB | 1024 |
1 MiB | 1048576 |
100 MiB | 104857600 |
1 GiB | 1073741824 |
1 TiB | 1099511627776 |