首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    linux下压缩与解压缩-tar和zip_linux打包命令

    图 13总结:通过测试,在本次实验中我们得出的以下几点结论:1. 小文件(最好是大于 0.5M,如果文件太小,在进行 tar 打包并压缩或者 zip 压缩时,其占用的磁盘空间会比源文件大很多)在进行 tar 打包并压缩或者 zip 压缩时,其占用磁盘的大小不变;中等文件(100M 左右的 pdf 格式文件) ,在进行 tar 打包并压缩或者zip 压缩时时,大约节省 20%-30%的空间;对于大文件(500M 左右的视频文件)基本上没有节省多少磁盘空间。2. 在 Radhat5.5 中对于 tar 打包并压缩测试和 zip 压缩测试中,tar 和 zip 对文件的压缩是一样的,对磁盘的节省程度是一样的。3. 本次测试中由于选择文件的特殊性,不能够完全模仿在真实情况下的操作,所以得出的结论会有一定程度的误差。由于 cuizong007 的水平有限,难免有错误的地方,还请多多包涵。欢迎各位技术好友进行技术方面的交流。cuizong007 的邮箱是:cuizong007sina.com图 5图 67.对文件 2 进行查看(如图 7 和图 8):图 7图 88. 对文件 3 进行 tar 和 zip 压缩(如图 9 和图 10):图 9图 109. 对文件 2 进行查看(如图 11 和图 12):图 11图 1210.在将所有的文件进行 tar 和 zip 压缩完后,查看压缩完后的情况(如图 13):在 linux 下人们不免会遇到要压缩一些文件,但是究竟要那种方式压缩,所得到的结果最能够节省磁盘的空间,而且有不容易出现错误呢?本次实验结果只做技术讨论,相互的学习。实验环境:在 xp 系统下安装在虚拟机上的 redhat5.5 的系统。本次实验结果将主要测试最常用的、最简单的(即没有添加太复杂的命令选项)tar 和 zip命令。1. 我们选择了三个不同大小的文件(文件名分别为:1、2 和 3;文件 1 和文件 2 都是 pdf文档;文件 3 为视频文件)如图 1 所示:图 12. 我们首先使用命令 tar 将第一个小文件(即 1)进行压缩。 (使用命令: tar zcvf 1.tar.gz 1)如图 2 所示:图 23.再使用命令 zip 压缩第一个小文件(即 1)进行压缩。 (使用命令: zip 1.zip 1)如图 3所示:图 34.使用命令查看 tar 和 zip 压缩同一文件 1 的大小(使用命令:

    02

    Linux文件属性详解

    文件存储在硬盘上,硬盘的最小存储单位叫做"扇区"(sector)。每个"扇区"的大小为512字节(byte), ,操作系统读取硬盘的时候,不会一个个扇区的读取,这样效率太慢。他是一次性读取多个扇区,即一次性读取一个"Block块"。一个Block有8个连续的扇区(sector)组成。 数据都存在Block块里面,但是我们怎么知道一个数据存放在哪些Block块里面呢?这个时候就必须需要一个索引,引导我们去找到哪些存放在BLOCK块里面的额数据。这存放索引的地方我们称为索引节点(Inode),索引节点里面包括了:文件的类型,属主,属组,权限,和时间戳一些信息,但是不包括文件名, 1.1.2 inode包含的内容

    02

    解决小文件问题

    为了解决小文件问题,我们也是八仙过海各显神通,一般而言可能都是写个MR/Spark程序读取特定目录的数据,然后将数据重新生成N个文件。但是在以前,这种模式会有比较致命的问题,因为在生成的新文件要替换原来的文件,而替换的过程不是原子过程,所以这个时候如果正好发生读,是会影响的。其次,很多读的程序,都会缓存文件路径,因为我们重新生成了文件,文件名称也变化了,导致读的程序的缓存失效,会发生比如文件找不到等异常。对于在一个进程比较好说,做下刷新就行,但是读往往是在不同的进程实例里,这个时候通知他们也是很难的事情。再极端一点,读取这个表的程序可能是另外一个团队维护的。所以其实小文件并没有想象的那么好解决,或者说能够优雅的解决。

    02

    如何使用Linux dd命令克隆磁盘

    在本教程中,我们将参考Linux dd命令的一个实际示例,系统管理员可以使用该命令将以MBR或GPT布局样式分区的较大HDD的Windows操作系统或Linux操作系统迁移到较小的SSD。 在本节摘录中,我们将使用安装在具有多个分区的硬盘上的Windows系统作为示例。 在HDD以MBR方案分区并且包含具有多个逻辑分区的扩展分区或分区无序的情况下,该方法可能变得相当复杂。 如果是这样,我建议你不要使用这种方法。 在这种情况下,使用ddrescure更安全,它可以克隆整个磁盘布局(分区表和每个分区内的已使用块),而不会实际传输空的空间。 可以通过从Ubuntu主存储库安装gddrescue包获得DDrescure。

    02

    我们常说的海量小文件的根源是什么?

    为了解决小文件问题,我们也是八仙过海各显神通,一般而言可能都是写个MR/Spark程序读取特定目录的数据,然后将数据重新生成N个文件。但是在以前,这种模式会有比较致命的问题,因为在生成的新文件要替换原来的文件,而替换的过程不是原子过程,所以这个时候如果正好发生读,是会影响的。其次,很多读的程序,都会缓存文件路径,因为我们重新生成了文件,文件名称也变化了,导致读的程序的缓存失效,会发生比如文件找不到等异常。对于在一个进程比较好说,做下刷新就行,但是读往往是在不同的进程实例里,这个时候通知他们也是很难的事情。再极端一点,读取这个表的程序可能是另外一个团队维护的。所以其实小文件并没有想象的那么好解决,或者说能够优雅的解决。

    02

    Linux(一)

    如果我们要介绍 Linux,我们就不得不首先说一下 Unix。 Unix: 一种多用户、多进程的计算机操作系统,开发于 1970 年在美国 AT&T 公司的贝尔实验室的 AT&T Unix。 此后的 10 年,Unix 在学术机构和大型企业中得到了广泛的应用,当时的 Unix 拥有者 AT&T 公司以低廉甚至免费的许可将 Unix 源码授权给学术机构做研究或教学之用,许多机构在此源码基础上加以扩充和改进,形成了所谓的 “Unix 变种”。 最著名的变种之一是由加州大学 Berkeley 分校开发的 BSD(Berkeley Software Distribution)。 后来 AT&T 意识到了 Unix 的商业价值,不再将 Unix 源码授权给学术机构,并对之前的 Unix 及其变种声明了版权。BSD 在 Unix 的历史发展中具有相当大的影响力,被很多商业厂家采用,成为很多商用 Unix 的基础。其不断增大的影响力终于引起了 AT&T 的关注,于是开始了一场持久的版权官司。最终允许 Berkeley 分校自由发布自己的 Unix 变种,但是前提是必须将来自于 AT&T 的代码完全删除,于是诞生了 4.4 BSD Lite 版,由于这个版本不存在法律问题,4.4 BSD Lite 成为了现代柏克莱软件套件的基础版本。BSD 在发展中也逐渐衍生出3个主要的分支:

    02

    inode、block和磁盘性能的关系 原

    理解inode,要从文件储存说起。   文件储存在硬盘上,硬盘的最小存储单位叫做"扇区"(即:Sector)。每个扇区储存512字节(相当于0.5KB)。   操作系统读取硬盘的时候,不会一个个扇区地读取,这样效率太低,而是一次性连续读取多个扇区,即一次性读取一个"块"(block)。这种由多个扇区组成的"块",是文件存取的最小单位。"块"的大小,最常见的是4KB,即连续八个 sector组成一个 block。   文件数据都储存在"块"中,那么很显然,我们还必须找到一个地方储存文件的元信息,比如文件的创建者、文件的创建日期、文件的大小等等。这种储存文件元信息的区域就叫做inode,中文译名为"索引节点"。   block中存储的就是文件的实际数据,比如说,照片,视频,音频等等,但是有一点需要注意!就是inode当中不包含文件名!一个文件的文件名,存储在上级目录的block中!   其实inode和block之间的关系就像是一本书一样,inode是一本书的目录,一本书会有很多内容,一个知识点或者一个故事会占很多页,一个block就相当于书中的一页内容。

    03
    领券