前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >用 Python 快速找到最大的文件

用 Python 快速找到最大的文件

作者头像
somenzz
发布于 2021-11-12 08:41:04
发布于 2021-11-12 08:41:04
71900
代码可运行
举报
文章被收录于专栏:Python七号Python七号
运行总次数:0
代码可运行

现在的电脑差不多都是固态硬盘了,速度很快,但容量不会太大,经常会出现磁盘空间不足的情况,怎么办,删除那些不重要的最大的文件是最有效的办法。

那么如何用找到最大的文件呢?比如说找到最大的前 10 个文件?

思路:我们遍历目录,将文件路径和文件大小作为生成器返回,然后插入大小为 10 的大顶堆,最后将大顶堆的内容打印即可。

借助 Python,代码很简洁:

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
import os
import time

from os.path import join, getsize
from heapq import nlargest


def walk_files_and_sizes(start_at: str):
    for root, _, files in os.walk(start_at):
        for file in files:
            path = join(root, file)
            try:
                size = getsize(path)  # bytes
                yield path, size
            except OSError:
                continue


def largest_files(n: int, start_at: str) -> None:
    MB = 1024 * 1024
    largest = nlargest(n, walk_files_and_sizes(start_at), key=lambda x: x[1])

    for path, size in largest:
        print(f'{size//MB} MB {path}')



if __name__ == '__main__':
    start = time.perf_counter()
    largest_files(10, "/Users/aaron/")
    elapsed = time.perf_counter() - start
    print(f'{elapsed} seconds elapsed')

我在自己电脑上跑了下,200 GB 左右的目录,123 秒就跑完了:

接下来删除不需要的文件就可以了。

如果是 Windows 系统也是可以的:

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
largest_files(10, "C:/Users/xxx/")

最后的话

本文的方法非常实用,可以收藏,说不定那天,这个小工具就帮你解决了大问题。

如果喜欢本文,可以点赞、关注、转发,感谢支持。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2021-11-06,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 Python七号 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 最后的话
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档