操作指南

最近更新时间:2026-06-26 18:02:30

我的收藏

前提条件

已创建 Turbo 文件系统,创建流程请参见 在 Linux 客户端上使用 CFS Turbo 文件系统
注意:
数据检索功能仅支持 Turbo 系列文件系统,且需 提交工单 申请开白使用。

操作步骤

步骤1:进入数据检索页面

支持以下两种方式:
登录 文件存储控制台,在左侧导航栏中,选择数据管理 > 数据检索,进入检索策略列表页。
登录 文件存储控制台,单击文件系统 ID,进入文件系统详情页,选择数据检索标签页,可以查看该文件系统下的策略。

步骤2:创建检索策略

1. 在数据检索列表页面,单击新建检索策略
2. 在弹出的对话框中,配置基本信息:
检索名称:策略的名称,最多60个字符。建议填写业务含义明确的名称
文件系统 ID:选择需要进行数据检索的目标文件系统。从文件系统详情页进入会默认展示对应文件系统,无需选择。
3. 选择任务类型。至少勾选以下一种:
聚合统计(默认勾选):统计文件数量、文件容量、目录数量等汇总信息。适合快速了解存储概况。
数据清单:生成符合检索条件的文件/目录清单,支持下载。适合需要获取具体文件列表的场景。
4. 配置检索条件。系统提供两种方式设置检索条件:
条件生成器(推荐新手使用)
SQL 语句(高级)
通过可视化界面添加筛选条件,无需手写 SQL,适合快速上手。多个条件之间可选择 AND(同时满足)或 OR(满足任意一个)逻辑关系,每个条件支持复制和删除操作。系统会实时展示对应生成的 SQL 语句,方便学习和参考。具体条件类型如下:
条件类型
说明
文件大小
设置文件大小范围(支持 KiB/MiB/GiB 单位)
目录路径
限定检索的目录前缀,需以 /cfs/ 开头、* 结尾
最后访问时间
支持绝对时间(精确日期)和相对时间(如近30天)
数据冷热状态
按冷数据/热数据筛选
文件后缀
按文件扩展名筛选,需以 * 开头
示例1:查找冷数据
添加以下检索条件:
条件类型:选择数据冷热状态
冷热状态:选择热数据
系统自动生成对应的 SQL 语句,您无需手动编写。

示例2:查找指定目录下的大文件
添加以下检索条件:
1. 条件1:
条件类型:选择文件大小
大小范围:设置为 1,单位选择 GiB(即大于 1 GiB)。
2. 单击+ 添加检索条件,添加条件2:
条件类型:选择目录路径
目录路径:填写 /cfs/data/*
3. 两个条件的逻辑关系保持为且(AND),组合后的查询条件为:目录路径 = /cfs/data/* AND 文件大小 > 1GiB。

示例3:查找最近访问且后缀为 .log 的日志文件
添加以下检索条件:
1. 条件1:
条件类型:选择最后访问时间
最后访问时间:选择相对时间设置为 90,单位选择(即近90天以内)。
2. 单击+ 添加检索条件,添加条件2:
条件类型:选择文件后缀
文件后缀:填写 *.log(按文件扩展名筛选,需以 * 开头)。
3. 两个条件的逻辑关系保持为且(AND),组合后的查询条件为:最后访问时间 90 天以内 AND 文件后缀 = *.log

适合有复杂检索需求的高级用户,可手写任意合法的 SQL 表达式。SQL 模式下分为两种语法:
聚合统计 SQL 语句:用于汇总统计。
数据清单查询语句:用于导出文件列表。
详细语法说明和示例请参见 SQL 参考指南,更多介绍请参见 ES 官网
注意:
使用 SQL 模式时,请确保语法正确,否则任务执行会失败,无法获得预期数据。
默认文件大小单位为字节(B),控制台会自动将单位转换为 KiB/MiB/GiB。建议您编辑 SQL 语句时不要修改 totalsize=sum(size),避免单位转换错误。
5. (可选)设置定期执行。如需自动定期执行,勾选定期执行周期并配置。
周期:选择按周(选择星期几)或按月(选择几号)。
日期:按周时选择星期,按月时输入日期(1 - 31)。
执行时间:选择每天的执行时间点(可多选小时)。所选时间点将整点触发,每个被勾选的小时都会独立执行一次检索任务。例如同时勾选02:00、11:00、14:00、21:00,则每天02:00、11:00、14:00、21:00各执行一次。
执行时长:首次检索任务为全量扫描,后续扫描为增量扫描,执行时长取决于文件数据量,通常在 5 分钟以内。
6. 单击保存策略

步骤3:执行检索任务

注意:
数据检索采用首次全量扫描,后续增量扫描来加速检索效率,因此首次执行检索任务时间可能较长,请您耐心等待。
手动执行
定期自动执行
1. 在检索策略列表页,找到目标策略。
2. 在列表页操作栏,单击手动执行。您也可以进入策略详情页,单击右上角的手动执行
3. 系统将立即创建并执行一次检索任务,自动跳转到策略详情页,您可以在详情页查看执行结果。
如果在创建策略时配置了定期执行周期,系统会按照设定的时间自动触发,无需手动干预。
单击策略 ID,进入策略详情页查看执行记录。您随时可以启停和修改检索任务定期执行计划。修改配置方法请参见 编辑检索策略

步骤4:查看任务结果

1. 在检索策略列表页,单击目标策略 ID,进入策略详情页。
2. 在任务执行记录列表中,查看任务执行情况:
字段
说明
任务 ID
每次执行的唯一标识。
状态
排队中 / 执行中 / 执行成功 / 执行失败。鼠标悬停在状态为执行失败的任务上,可查看具体错误信息。
文件数量
符合条件的文件总数(任务成功后显示)。
文件容量
符合条件的文件总容量(任务成功后显示)。
目录数量
符合条件的目录总数(任务成功后显示)。
创建时间
任务触发时间。
文件清单
数据清单结果下载链接(有效期7天,请及时下载),超期后需重新执行任务获取。


管理检索策略

编辑检索策略

1. 数据检索列表页,找到目标策略。
2. 在操作列,单击编辑
3. 在弹出的对话框中,修改检索名称、检索条件或定期执行周期。
4. 单击保存策略
注意:
文件系统 ID 不可修改。​ 如需更换目标文件系统,请直接新建一条检索策略。
修改后无法回滚。​ 系统不保留修改前的策略详情,请谨慎操作。
若修改时间晚于检索任务的实际执行时间,建议您重新执行该任务,以确保检索结果基于最新的策略生成。

删除检索策略

1. 数据检索列表页,找到目标策略。
2. 在操作列,单击删除
3. 在弹出的确认对话框中单击确定
注意:
删除策略后,历史任务记录同步清除,请谨慎操作。

搜索与筛选

数据检索列表页 支持切换地域,并支持以下搜索方式:
搜索维度
说明
数据检索策略 ID
输入策略 ID(格式为 dataretrieval-xxxxxxxx)精确搜索。
数据检索名称
输入策略名称关键词模糊搜索。
文件系统 ID
输入关联的文件系统 ID 查找。

SQL 参考指南

本节详细介绍数据检索中使用的两种 SQL 语法。如果您是首次使用,建议先通过条件生成器熟悉基本用法,再逐步学习 SQL 模式。

聚合统计 SQL 语句

聚合统计 SQL 用于对文件系统中的文件进行汇总统计。

基本结构

from entries | where <筛选条件> | stats <统计指标>

关键字与参数说明

关键字/参数
含义
说明
from entries
数据源
固定写法,表示从文件系统的文件条目中检索,不可更改
where
筛选条件
类似 SQL 的 WHERE,用于过滤符合条件的文件
stats
统计输出
类似 SQL 的 SELECT + GROUP BY,定义要输出的统计指标
size
文件大小
文件的字节大小,可配合 ><>=<= 使用
path
文件路径
文件的完整路径,默认需以 /cfs/ 为路径前缀
type
条目类型
取值 "file"(文件)或 "directory"(目录)
hsm_status
冷热状态
取值 "new"(热数据)或 "released"(冷数据)
sum()
求和函数
对指定字段求和,如 sum(size) 表示总容量
count()
计数函数
对指定字段计数,如 count(path) 表示条目数

统计指标写法

stats 子句中,统计指标的格式如下,多个统计指标之间用逗号分隔。
stats 别名1=聚合函数1(字段) where <筛选条件1>, 别名2=聚合函数2(字段) where <筛选条件2>

示例

示例1:统计所有文件的容量和数量
from entries |where path like "/cfs/*" |stats totalsize=sum(size),filenum=count(path) where type=="file",dirnum=count(path) where type=="directory"
示例2:查找大于1GiB 的大文件并统计
from entries |where path like "/cfs/*" AND size >= 1073741824 |stats totalsize=sum(size),filenum=count(path) where type=="file",dirnum=count(path) where type=="directory"
说明:
查询语句中文件大小以字节(B)为单位。常用换算:1KiB = 1024B,1MiB = 1048576B,1GiB = 1073741824B,1TiB = 1099511627776B。
示例3:按路径前缀筛选并统计
from entries |where path like "/cfs/test/*" |stats totalsize=sum(size),filenum=count(path) where type=="file",dirnum=count(path) where type=="directory"

数据清单查询语句

数据清单查询语句用于筛选文件并生成文件列表下载。

基本格式

字段名:操作符值 AND/OR 字段名:操作符值

字段与操作符说明

字段
含义
示例
path
文件路径,可用于模糊匹配文件后缀
path:/cfs/subdir/*
path:*.dat
size
文件大小(单位 B,字节)
size:>=104857600 AND size:<10737418240
atime
最后访问时间
相对时间:atime:>now-1d
绝对时间:atime:[* TO "2026-06-18T16:00:00.000Z"}
hsm_status
数据冷热状态。
new:热数据
released:冷数据
hsm_status:new
hsm_status:released

逻辑连接符

连接符
含义
AND
同时满足所有条件
OR
满足任一条件

示例

示例1:查找指定路径下大于1GiB 的文件
path:/cfs/test/* AND size:>=1073741824
示例2:查找日志文件或临时文件
path:*.log OR path:*.tmp
示例3:查找指定路径下大于1GiB 且状态为冷数据的大文件
path:/cfs/test/* AND hsm_status:released AND size:>=1073741824

常见单位换算速查

在 SQL 中文件大小以字节为单位,以下为常用换算,进制为1024。
单位
字节数
1 KiB
1024
1 MiB
1048576
100 MiB
104857600
1 GiB
1073741824
1 TiB
1099511627776