首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >Hadoop HDFS-回收站(Trash)

Hadoop HDFS-回收站(Trash)

作者头像
运维小路
发布2025-07-24 17:47:25
发布2025-07-24 17:47:25
16400
代码可运行
举报
文章被收录于专栏:运维小路运维小路
运行总次数:0
代码可运行

作者介绍:简历上没有一个精通的运维工程师,下面的思维导图也是预计更新的内容和当前进度(不定时更新)。

中间件,我给它的定义就是为了实现某系业务功能依赖的软件,包括如下部分:

Web服务器

代理服务器

ZooKeeper

Kafka

RabbitMQ

Hadoop HDFS(本章节)

我们在使用Linux的服务器里面是没有回收站这个概念的(Windows是有这个概念的)。

上个小节我们已经介绍了HDFS可用使用快照方式来保护我们的数据,今天我们来介绍另外方式就是回收站,他就和Windows回收站类似,当然也有不一样的地方,下面我们就来详细介绍。

1. 回收站核心原理

删除 ≠ 立即清除:执行 hdfs dfs -rm 删除文件时:

代码语言:javascript
代码运行次数:0
运行
复制
# 文件被移动到回收站(重命名)
#删除前文件路径
/user/alice/data.txt 

#删除后文件路径 
/user/alice/.Trash/Current/user/alice/data.txt

保留策略:文件在回收站保留 fs.trash.interval 小时(默认0=关闭回收站),超时自动删除。

物理存储:文件仍占用 HDFS 空间,直到被永久清除

2. 启用与配置回收站:core-site.xml

该操作需要重启NameNode节点服务。

代码语言:javascript
代码运行次数:0
运行
复制
<!-- 启用回收站并保留48小时 -->
<property>
  <name>fs.trash.interval</name>
  <value>48</value> 
</property>
<property>
  <name>fs.trash.checkpoint.interval</name>
  <value>30</value> <!-- 每30分钟创建检查点 -->
</property>

3.删除文件(进回收站)

删除文件是有提示的,他会提示存储的路径的改变,类似Linux的mv操作。

代码语言:javascript
代码运行次数:0
运行
复制
[root@node1 ~]# hdfs dfs -rm /test2/apache-zookeeper-3.8.1-bin.tar.gz
25/07/18 00:53:25 INFO fs.TrashPolicyDefault: Moved: 'hdfs://mycluster/test2/apache-zookeeper-3.8.1-bin.tar.gz' to trash at: hdfs://mycluster/user/root/.Trash/Current/test2/apache-zookeeper-3.8.1-bin.tar.gz
[root@node1 ~]# 

查看删除文件

代码语言:javascript
代码运行次数:0
运行
复制
[root@node1 ~]# hdfs dfs -ls /user/root/.Trash/Current/test2
Found 1 items
-rw-r--r--   3 root supergroup   13368512 2025-07-18 00:52 /user/root/.Trash/Current/test2/apache-zookeeper-3.8.1-bin.tar.gz
[root@node1 ~]# 

4.删除文件(不进回收站)

类似Windows强制删除,不进回收站,一般删除很大的文件会直接提示。

代码语言:javascript
代码运行次数:0
运行
复制
[root@node1 ~]# hdfs dfs -rm -skipTrash /test1/hadoop-env.sh
Deleted /test1/hadoop-env.sh
[root@node1 ~]# 

5.清理回收站

代码语言:javascript
代码运行次数:0
运行
复制
[root@node1 ~]# hdfs dfs -expunge  
25/07/18 00:58:15 INFO fs.TrashPolicyDefault: TrashPolicyDefault#deleteCheckpoint for trashRoot: hdfs://mycluster/user/root/.Trash
25/07/18 00:58:15 INFO fs.TrashPolicyDefault: TrashPolicyDefault#deleteCheckpoint for trashRoot: hdfs://mycluster/user/root/.Trash
25/07/18 00:58:15 INFO fs.TrashPolicyDefault: TrashPolicyDefault#createCheckpoint for trashRoot: hdfs://mycluster/user/root/.Trash
25/07/18 00:58:15 INFO fs.TrashPolicyDefault: Created trash checkpoint: /user/root/.Trash/250718005815
[root@node1 ~]# 
#或者直接删除回收站的里面的文件

6.恢复回收站

这个其实就是直接复制文件,把回收站的文件复制出来。这里特别注意的就是这个用户目录。

代码语言:javascript
代码运行次数:0
运行
复制
# 从回收站复制回原路径
hdfs dfs -mv \
  /user/alice/.Trash/Current/path/to/file.txt \ 
  /path/to/file.txt
本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2025-07-19,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 运维小路 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 1. 回收站核心原理
  • 2. 启用与配置回收站:core-site.xml
  • 该操作需要重启NameNode节点服务。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档