Linux下文件的压缩与打包详解

在Linux中,有很多的压缩命令。利用这些压缩命令,可以方便的从网络上下载大型的文件。同时,我们知道,Linux文件的扩展名是没有特殊意义的,不过,因为Linux下存在着许多压缩命令,所以为了方便记忆,会对这些命令所压缩的文件进行一些特殊的命名方式。本篇随笔将主要记录一下Linux系统常见的压缩命令。

图片[1]-Linux下文件的压缩与打包详解-趣考网

一、压缩文件的原理

压缩技术,简而言之,我们可以将其想象成:其实文件里面有很多的\"空间\"存在,并不是完全填满的,而\"压缩\"技术就是将这些\"空间\"填满,从而使得整个文件占用量下降。

目前我们的操作系统数据中,都是使用字节(byte)单位来计量,不过事实上,计算机中最小的计量单位应该是位(bit),我们知道 1 byte = 8 bit。那么我们是怎么样对一些数据进行记录的呢?

例如我们只是需要记忆一个数字,即1这个数字,考虑到计算机所谓的二进制,如此一来, 1 会在最右边占据 1 个 bit ,而其他的 7 个 bits 将会自动的被填上 0 !其实在这样的例子中,那 7 个 bits 应该是 【空的】 才对!不过,为了要满足目前我们的操作系统数据的存取,所以就会将该数据转为 byte 的型态来记录。而压缩技术就是将这些没有使用到的空间\"丢\"出来。

文件压缩以后可以降低磁盘的使用量,减少文件的大小。不过这些\"压缩过的文件\"无法直接被操作系统所使用,因此,若要使用这些被压缩过的文件数据,则必须将它\"还原\"成未被压缩的样子,这就是\"解压缩\"。

二、Linux系统常见的压缩命令

在Linux的环境中,压缩文件的扩展名大多是:【*.tar, *.tar.gz, *.tgz, *.gz, *.Z, *.bz2】,为什么会有这么多种的扩展名呢?

这是因为 Linux 支持的压缩命令非常多,且不同的命令所用的压缩技术并不相同,当然彼此之间可能就无法互相压缩/解压缩文件。 所以,当你下载到某个压缩文件时,自然就需要知道该文件是由哪种压缩命令所制作出来的,这样才可以使用对应的压缩命令对其进行解压缩。 虽然 Linux 文件的属性基本上是与文件名没有绝对关系的, 但是为了帮助我们进行识别,所以适当的扩展名还是必要。目前Linux系统中一些常用的压缩文件的扩展名如下大致有以下几种:

*.Z compress 程序压缩的文件; //在当前的Linux主流版本中都已经默认没有支持该压缩命令了,因为gzip命令已经取代了compress命令了

*.gz gzip 程序压缩的文件;

*.bz2 bzip2 程序压缩的文件;

*.tar tar 程序打包的数据,并没有压缩过;

*.tar.gz tar 程序打包的文件,其中并且经过 gzip 的压缩

*.tar.bz2 tar 程序打包的文件,其中并且经过 bzip2 的压缩

接下来我们来看一下Linux系统下常见的一些压缩命令。

1.gzip、zcat

gzip 可以说是使用最广的压缩命令了!目前 gzip 可以解压 compress, zip 与 gzip 等软件所压缩的文件。 通过gzip命令所创建的压缩文件为 *.gz 的文件名。

[root@localhost ~]# gzip [-cdtv#] 文件名

[root@localhost ~]# zcat 文件名.gz

选项与参数:

-c :将压缩的数据输出到屏幕上,可通过过数据流重导向来处理;

-d :解压缩的参数;

-t :可以用来检验一个压缩文件的一致性,看看文件有无错误;

-v :可以显示出原文件/压缩文件的压缩比等信息;

-# :压缩等级(1~9),-1 最快,但是压缩比最差、-9 最慢,但是压缩比最好!默认是 -6

实例一:将 /etc/passwd 复制到 /home 目录下,并且以gzip进行压缩

[root@localhost home]# cp /etc/passwd passwd

[root@localhost home]# ls -l

-rw-r--r--. 1 root root 2679 4月 26 19:37 passwd

[root@localhost home]# gzip passwd

[root@localhost home]# ls -l

-rw-r--r--. 1 root root 1066 4月 26 19:37 passwd.gz

# 此时我们会发现我们刚才复制过来的 passwd 这个文件已经变成了 passwd.gz 这个压缩文件了

实例二:将实例一的文件内容读出来

[root@localhost home]# zcat passwd.gz

root:x:0:0:root:/root:/bin/bash

bin:x:1:1:bin:/bin:/sbin/nologin

daemon:x:2:2:daemon:/sbin:/sbin/nologin

adm:x:3:4:adm:/var/adm:/sbin/nologin


....................................此处省略N个字
......................................

#此时我们可以看到 passwd.gz 解压缩之后的文件内容

实例三:将实例一的文件进行解压缩

[root@localhost home]# gzip -d passwd.gz

[root@localhost home]# ls -l

-rw-r--r--. 1 root root 2679 4月 26 19:37 passwd

#此时我们可以看到,刚才的passwd.gz 文件又被解压缩成了passwd这个文件了

实例四:将实例三解压缩的passwd文件用最佳压缩包进行压缩,并保留原来的文件

[root@localhost home]# gzip -c9 passwd > passwd.gz

[root@localhost home]# ls -l passwd*

-rw-r--r--. 1 root root 2679 4月 26 19:37 passwd

-rw-r--r--. 1 root root 1066 4月 26 19:52 passwd.gz

注意:当你使用 gzip 进行压缩时,在默认的状态下原本的文件会被压缩成为 .gz 的文件名, 原始文件就不再存在了。所以如果要保留原来的文件,可以使用实例四的方法来进行压缩

我们知道,cat命令可以用来读取一个文本文件的内容,那么我们如果要来读取压缩文件数据内容要使用什么命令呢?就是上面实例的 zcat 命令了。

2.bzip2、bzcat

如果说gzip是为了取代compress命令,那么bzip2这个命令就是gzip的另一个升级版本

[root@localhost ~]# bzip2 [-cdkzv#] 文件名

[root@localhost ~]# bzcat 文件名.bz2

选项与参数:

-c :将压缩的过程产生的数据输出到屏幕上

-d :解压缩的参数

-k :保留原始文件,而不会删除原始的文件

-z :压缩的参数

-v :可以显示出原文件/压缩文件的压缩比等信息;

-# :与 gzip 同样的,都是在计算压缩比的参数, -9 最佳, -1 最快!

实例一:将刚才的passwd进行压缩

[root@localhost home]# bzip2 -z passwd

[root@localhost home]# ls -l passwd*

-rw-r--r--. 1 root root 1102 4月 26 19:37 passwd.bz2

# 此时passwd已经变成了passwd.bz2文件了

实例二:将实例一的文件进行解压缩

[root@localhost home]# bzip2 -d passwd.bz2

[root@localhost home]# ls -l passwd*

-rw-r--r--. 1 root root 2679 4月 26 19:37 passwd

实例三:将实例二的文件进行压缩,并保留原来的文件

[root@localhost home]# bzip2 -zk passwd

[root@localhost home]# ls -l passwd*

-rw-r--r--. 1 root root 2679 4月 26 19:37 passwd

-rw-r--r--. 1 root root 1102 4月 26 19:37 passwd.bz2

# -k这个参数就可以保留原文件 或者使用 bzip2 -c passwd > passwd.bz2 这个命令也可以

使用gzip,扩展名自动为.gz。使用bzip2的话,扩展名就自动变成了.bz2.同样,如果我们需要读取bzip2压缩文件的数据内容时,使用bzcat命令即可

3.tar

这个命令我们应该见得挺多的,之前在进行解压缩时,通常都是使用这个命令

上面提到的几个命令大多仅能针对单一文件来进行压缩,虽然 gzip 与 bzip2 也能够针对目录来进行压缩, 不过,这两个命令对目录的压缩指的是【将目录内的所有文件 \"分别\" 进行压缩】的动作! 而不像在 Windows 的系统,可以使用类似 WinRAR这一类的压缩软件来将好多数据【打包成一个文件】的样式。

这种将多个文件或目录包成一个大文件的命令功能,我们将其称为 打包命令! 那么Linux系统下有没有这样的命令呢?当然是有点,tar命令就是咱们需要的打包命令。 tar 可以将多个目录或文件打包成一个大文件,同时还可以透过 gzip/bzip2 的支持,将该文件同时进行压缩。

[root@localhost ~]# tar [-j|-z] [cv] [-f 创建的文件名] filename... <==打包与压缩

[root@localhost ~]# tar [-j|-z] [tv] [-f 创建的文件名] <==查看文件名

[root@localhost ~]# tar [-j|-z] [xv] [-f 创建的文件名] [-C 目录] <==解压缩

选项与参数:

-c :创建打包文件,可搭配 -v 来察看过程中被打包的档名(filename)

-t :查看tarfile里的文件

-x :解打包或解压缩的功能,可以搭配 -C (大写) 在特定目录解开

特别留意的是, -c, -t, -x 不可同时出现在一串命令列中。

-j :通过 bzip2 的支持进行压缩/解压缩:此时文件名最好为 *.tar.bz2

-z :通过 gzip 的支持进行压缩/解压缩:此时文件名最好为 *.tar.gz

-v :在压缩/解压缩的过程中,将正在处理的文件名显示出来

-f filename:-f 后面要立刻接要被处理的文件名!建议 -f 单独写一个选项

-C 目录 :这个选项用在解压缩,若要在特定目录解压缩,可以使用这个选项。

-p :保留备份数据的原本权限与属性,常用於备份(-c)重要的配置文件

-P :保留绝对路径,亦即允许备份数据中含有根目录存在之意;

--exclude=FILE:在压缩的过程中,不要将 FILE 打包

实例一:将这个/etc目录下的文件全部打包成 /home/etc.tar

[root@localhost home]# tar -cvf etc.tar /etc -->> 这个命令只是用来打包,不进行压缩

[root@localhost home]# tar -zcvf etc.tar /etc -->> 打包以后,使用gzip 对其进行压缩

[root@localhost home]# tar -jcvf etc.tar /etc -->> 打包以后,使用bzip2 对其进行压缩

# 特别注意,在参数 f 之后的档案档名是自己取的,我们习惯上都用 .tar 来作为标识。

# 如果加 z 参数,则以 .tar.gz 或 .tgz 来代表 gzip 压缩过的 tar file

# 如果加 j 参数,则以 .tar.bz2 来作为扩展名

实例二:查看上述etc.tar 文件里有哪些内容

[root@localhost ~]# tar -ztvf etc.tar

# 由于我们使用 gzip 压缩,所以要查阅该 tarfile 内的文件时,

# 就得要加上 z 这个参数

实例三:将etc.tar 文件解压缩到当前目录下

[root@localhost home]# tar -zxvf etc.tar

# 此时我们可以发现当前目录下已经有了一个etc的文件夹,里面就是我们解压缩出来的文件

实例四:如果我只是希望将 etc.tar 中的 etc/passwd 解压出来

[root@localhost home]# tar -zxvf etc.tar etc/passwd

# 我可以通过 tar -ztvf 来查阅 tarfile 内的文件名,如果单只要一个文件,

# 就可以通过这个方式来完成。注意到! etc.tar.gz 内的根目录 / 不见了

实例五:备份/etc 内的所有文件,并且保存其权限

[root@localhost home]# tar -zxvpf etc.tar.gz /etc/

# 这个 -p 的属性是很重要的,尤其是当您要保留原本文件的属性时

实例六:在/home 中,比2013/04/01 新的文件就进行备份

[root@localhost home]# tar -N \'2013/04/01\' -zcvf home.tar /home

实例七:我要备份/home,/etc的所有文件,但是不要备份/home/localhost 这个目录下的文件

[root@localhost home]# tar --exclude /home/localhost -zcvf myfile.tar.gz /home/* /etc

通过上面的一些实例,可以看到tar这个命令是一个多用途的压缩命令。我们通过tar命令可以完成备份的功能。由于tar整合过后的文件我们通常取名为 *.tar,如果在打包过程中还是用了gzip的压缩属性,则将文件取名为*.tar.gz。

© 版权声明
THE END
喜欢就支持一下吧
点赞13 分享