Linux文件类基础命令

回到Linux基础系列文章大纲
回到Shell系列文章大纲


关于路径和通配符

Linux中分绝对路径和相对路径,绝对路径一定是从 / 开始写的,相对路径不从根开始写,还可能使用路径符号。

路径展开符号:

1
2
3
4
5
6
7
.  :(一个点)表示当前目录
.. :(两个点)表示上一层目录
- :(一个短横线)表示上一次使用的目录,例如从/tmp直接切换到/etc下,"-"就表示/tmp
~ :(波浪符号)表示用户的家目录,例如"~account"表示account用户的家目录
/dir/和/dir:一般都表示dir目录和dir目录中的文件。但在有些地方会严格区分是否加尾
随斜线,此时对于加了尾随斜线的表示此目录中的文件,不加尾随斜线的表示
该目录本身和此目录中的文件

切换路径用 cd 命令;

显示当前所在目录用 pwd 命令。若当前所在目录为链接目录,使用 pwd 显示的将是链接自身,使用 -P 选项将定位到链接的原始目录。

1
2
3
4
5
[root@xuexi ~]# ll ; cd tmp; pwd; pwd -P
total 0
lrwxrwxrwx 1 root root 4 May 30 19:17 tmp -> /tmp
/root/tmp
/tmp

获取文件名使用 basename 命令,获取文件所在目录使用 dirname 命令。注意,这两个命令其实不太完善,它不会检查文件或目录是否存在,只要写出来了就会去获取。

1
2
3
4
5
6
7
8
9
10
[root@xuexi tmp]# basename /etc/shadow
shadow
[root@xuexi tmp]# basename /etc/
etc
[root@xuexi tmp]# dirname /etc/shadow
/etc
[root@xuexi tmp]# dirname /etc/ # 对目录使用dirname获取的是上级目录
/
[root@server1 ~]# dirname /kalsldk/kdkskks/djfjdjdjsj # 获取不存在的目录
/kalsldk/kdkskks

bash shell 通配符:

可以使用 “*”、”?”、”[]” 等的通配符来扩展路径或文件名。例如, ls *.log 将列出当前路径下所有以 “.log” 字符结尾的文件名 (但不包括 “.” 开头的隐藏文件)。

默认情况下,bash 提供的通配符规则比较弱,例如 “*” 无法匹配文件名开头的 “.”,无法匹配路径分隔符号 (即斜线 “/“),但可以通过 set 或 shopt 命令开启额外的通配功能,实现更完善的通配符规则。

例如,默认情况下,想要匹配目录 / path 下所有隐藏文件和非隐藏文件,如下:

1
ls  .*  *

开启 dotglob 功能,”*” 就可以匹配以 “.” 开头的文件:

1
2
shopt -s dotglob
ls *

有时想要递归到目录内部,又想要匹配文件名,例如想要递归找出多层目录 / path 下所有的 “.css” 文件,这时可以开启 globstar 功能,使用 “两星连珠”(**) 就可以匹配匹配路径斜线。

1
2
shopt -s globstar       # 开启星号匹配模式
ls /path/**/*.css # 开启后,使用两个星号**就会匹配斜线

必须要说明的是,对于非 bash 内置命令,有些可能也提供了自己的通配符匹配方式,它们的通配模式和 shell 提供的可能并不一样。例如 find 的 “-name” 选项就可以采用自己的通配符,它的星号 “*“ 可以匹配以点开头的隐藏文件,如 find /var/log -name "*.log"

查看目录内容 (ls和tree)

ls 命令列出目录中的内容,和 dir 命令完全等价。tree 命令按树状结构递归列出目录和子目录中的内容,而 ls 使用 -R 选项时才会递归列出。

注意:ls 的结果中是以制表符分隔多个文件的。

ls命令

ls 的各个选项说明如下:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
-l:(long) 长格式显示,即显示属性等信息 (包括 mtime)。注意:显示的目录大小是节点所占大小。像 win 一样计算目录大小时包括文件大小要用 du -sh
-c:列出 ctime
-u:列出 atime
-d:(direcorty) 查看目录本身属性信息,不查看目录里面的东西。不加 - d 会查看里面文件的信息
-a:会显示所有文件,包括两个相对路径的文件 "." 和 ".." 以及以点开头的隐藏文件
-A:会列出绝大多数文件,即忽略两个相对路径的文件 "." 和 ".."
-h:(human) 人类可读的格式,将字节换成 k, 将 K 换成 M,将 M 换成 G
-i:(inode) 权限属性的前面加上一堆数字
-p:对目录加上 / 标识符以作区分
-F:对不同类型的文件加上不同标识符以作区分,对目录加的文件也是 /
-t:按修改时间排序内容。不加任何改变顺序的选项时,ls默认按照字母顺序排序
-r:反转排序
-R:递归显示
-S:按文件大小排序,默认降序排序
--color:显示颜色
-m:使用逗号分隔各文件,当然,只适用于未使用长格式 (ls -l) 的情况
-1:(数值一),以换行符分隔文件,当然,和-m或-l(小写字母) 是冲突的
-I pattern:忽略被 pattern 匹配到的文件

注意,ls 以 -h 显示文件大小时,一般显示的都是不带 B 的单位,如 K/M/G,它们的转换比例是 1024,如果显示的都是带了 B 的,如 KB/MB/GB,则它们的转换比例为 1000 而非 1024,一般很少显示带 B 的大小。

不得不说,ls 本身不能显示出文件的全路径名是一大缺陷,不过好在使用 find 命令可以很简单的就获取到。

以下是使用 ls -l 显示文件长格式的属性。

1
2
[root@xuexi ~]# ll /tmp
drwxr-xr-x 2 root root 4096 Mar 26 16:44 test1

可以查出 7 列属性。

tree命令

有可能 tree 命令不存在,需要安装 tree 包才有 (安装:yum -y install tree)。

tree 命令的选项说明如下:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
【 匹配选项:】
-L:用于指定递归显示的深度,指定的深度必须是大于 0 的整数。
-P:用于显示通配符匹配模式的目录和文件,但是不管是否匹配,目录一定显示。
-I:用于显示除被通配符匹配外的所有目录和文件。

【 显示选项:】
-a:用于显示隐藏文件,默认不显示。
-d:指定只显示目录。
-f:指定显示全路径。
-i:不缩进显示。和 -f 一起使用很有用。
-p:用于显示权限位信息。
-h:用于显示大小。
-u:显示 username 或 UID(当没有 username 时只能显示 UID 了)。
-g:显示 groupname 或 GID。
-D:显示文件的最后一次 Mtime。
--inodes:显示 inode 号。
--device:显示文件或目录所属的设备号。
-C:显示颜色。

【 输出选项:】
-o filename:指定将 tree 的结果输出到 filename 文件中。

下图是一个较全的输出结果。

文件的时间戳 (atime/ctime/mtime)

文件的时间属性有三种:atime/ctime/mtime。atime 是 access time,即上一次的访问时间;mtime 是 modify time,是文件的修改时间;ctime 是 change time,也是文件的修改时间,只不过这个修改时间计算的 inode 修改时间,也就是元数据修改时间。文件还有一个创建时间 (create time),大多数 unix 系统上都认为这是个无用的属性,一般工具无法获取这个时间,但是对于 ext 家族文件系统,通过它的底层调试工具 debugfs 可以获取 create time。

但 mtime 只有修改文件内容才会改变,更准确的说是修改了它的 data block 部分;而 ctime 是修改文件属性时改变的,确切的说是修改了它的元数据部分,例如重命名文件,修改文件所有者,移动文件 (移动文件没有改变 datablock,只是改变了其 inode 指针,或文件名) 等. 当然,修改文件内容也一定会改变 ctime(修改文件内容至少已经修改了 inode 记录上的 mtime,这也是元数据),也就是说 mtime 的改变一定会引起 ctime 的改变。

对目录而言,考虑目录文件的 data block,可知在目录中创建、删除文件以及目录内其他任意文件操作都会改变 mtime,因为目录里的任何东西都是目录中的内容;而目录的 ctime,除了目录的 mtime 引起 ctime 改变之外,对目录本身的元数据修改也会改变 ctime。

总结下:

  • (1).atime只在文件被打开访问时才改变,若不是打开文件编辑内容(如重定向内容到文件中),则 ctime 和 mtime 的改变不会引起atime的改变;
  • (2).mtime的改变一定引起ctime的改变,而访问文件时(例如cat),atime不一定会改变,所以atime”改变”(这个改变是假象,见下文分析)不一定会影响ctime。(见下面的relatime说明)

关于relatime

atime/ctime/mtime 是 Posix 标准要求操作系统维护的时间戳信息。但是每次将 atime、ctime 和 mtime 写入到硬盘中 (这些不会写入缓存,只要修改就是写入磁盘,即使从缓存读取文件内容也如此) 效率很低。有多低?下图是写 ctime 消耗的时间,几乎总要花费零点几秒。

mtime 要被修改,必然是修改了文件内容,这时候将 mtime 写入到硬盘中是应该的。但是 atime 和 ctime 呢?很多情况下根本用不到 atime 和 ctime,在频繁访问文件的时候,都要修改 atime 和 ctime,这样效率会降低很多很多,所以 mount 有个 noatime 选项来避免这种负面影响。

CentOS6 引入了一个新的 atime 维护机制 relatime:除非两次修改 atime 的时间超过 1 天 (默认设置 86400 秒),或者修改了 mtime,否则访问文件的 inode 不会引起 atime 的改变。换句话说,当 cat 一个文件的时候,它的 atime 可能会改变,但是你稍后再 cat,它不会再改变。

由于 cat 文件的时候 atime 可能不会改变,所以可能也就不会引起 ctime 的改变。

relatime维护的atime是可以控制的,详见man mount的relatime和redhat 官方手册

文件/目录的创建和删除

创建目录mkdir

1
2
3
4
mkdir [-mp] 目录名
【选项】
-m:表示创建目录时直接设置权限
-p:表示递归创建多层目录,即上层目录不存在时也会直接将其创建出来 (parent)

示例:

1
2
3
4
5
6
7
8
# 在tmp目录中创建一个test1目录
[root@xuexi ~]# mkdir /tmp/test1

# 直接创建test2时就赋予权限711
[root@xuexi ~]# mkdir -m 711 /tmp/test2

# 创建test5,此时会将不存在的test3和test4目录也创建好
[root@xuexi ~]# mkdir -p /tmp/test3/test4/test5

创建文件touch

1
touch file_name

示例:

1
2
3
4
[root@xuexi ~]# touch /tmp/test1/test1.txt

# 创建文件名为1-10的文件
[root@xuexi ~]# touch {1..10}

多个 {} 还可以交换扩展。类似(a+b)(c+d)=ac+ad+bc+bd

1
2
# 创建 a_c、a_d、b_c、b_d 四个文件
[root@xuexi ~]# touch {a,b}_{c,d}

touch 主要是修改文件的时间戳信息,当 touch 的文件不存在时就自动创建该文件。可以使用touch –c来取消创建动作。

touch 可以更改最近一次访问时间 (atime),最近一次修改时间 (mtime),文件属性修改时间 (ctime),这些时间可以通过命令 stat file 来查看。其中 ctime 是文件属性上的更改,即元数据的更改,比如修改权限。

touch -a修改 atime,-m 修改 mtime,没有修改 ctime 的选项。因为使用 touch 改变 atime 或 mtime,同时也都会改变 ctime,虽说 atime 并不总是会影响 ctime(如 cat 文件时)。

-t 选项表示使用 “[[CC]YY]MMDDhhmm[.ss]” 格式的时间替代当前时间。

1
2
# 将file的atime修改为2012年12月21号12点12分
shell> touch -a -t 201212211212 file

-d选项表示使用指定的字符串描述时间格式来替代当前时间,如”3 days ago”,”next Sunday”等很多种格式。

所以,touch 命令选项说明如下:

1
2
3
4
5
-c:强制不创建文件
-a:修改文件 access time(atime)
-m:修改文件 modification time(mtime)
-t:使用 "[[CC]YY]MMDDhhmm[.ss]" 格式的时间替代当前时间
-d:使用字符串描述的时间格式替代当前时间

删除文件/目录

1
2
3
4
5
rm [-rfi] file_name

-r:表示递归删除,删除目录时需要加此参数
-i:询问是否删除 (yes/no)
-f:强制删除,不进行询问
1
[root@xuexi ~]# rm -rf /tmp/test2

删除空目录时还可以使用 rmdir。

在删除文件之前,一定一定要确定是否真的删除。最好使用rm -i(默认已经在~/.bashrc 中定义了该别名),除非在脚本中,否则不要轻易使用 - f 选项。已经有非常多的人不小心rm -rf *rm -rf /NNNNN了。例如想删除rm –rf /abc*,结果习惯性的多敲了一个空格rm –rf /abc *,完了。

查看文件类型 file 命令

这是一个简单查看文件类型的命令,查看文件是属于二进制文件还是数据文件还是 ASCII 文件。

1
2
3
4
5
6
7
8
[root@xuexi tmp]# file /etc/aliases.db
/etc/aliases.db: Berkeley DB (Hash, version 9, native byte-order) # 数据文件

[root@xuexi tmp]# file ~/.bashrc
/root/.bashrc: ASCII text # ASCII文件

[root@xuexi tmp]# file /bin/ls
/bin/ls: ELF 64-bit LSB executable, x86-64, version 1 (SYSV), dynamically linked (uses shared libs), for GNU/Linux 2.6.18, stripped

除了基本的查看文件类型的功能外,file 还有一个 “-s” 选项,是一个超强力的选项,可以查看设备的文件系统类型。像有些分区工具如 parted 在分区时是可以指定文件系统的 (虽然不建议这么做,CentOS 7 的 parted 版本中已经取消了该功能),但在分区后格式化前,一般是比较难查看该分区的文件系统类型的,但使用 file 可以查看到。

1
2
3
4
5
6
7
[root@server1 ~]# file -s /dev/sda1
/dev/sda1: Linux rev 1.0 ext4 filesystem data (needs journal recovery) (extents) (huge files)

[root@server1 ~]# file -s /dev/sda
/dev/sda: x86 boot sector; GRand Unified Bootloader, stage1 version 0x3, boot drive 0x80, 1st sector stage2 0x7f86, GRUB version 0.94; partition 1: ID=0x83,
active, starthead 32, startsector 2048, 512000 sectors; partition 2: ID=0x83, starthead 254, startsector 514048, 37332992 sectors; partition 3: ID=0x82,
starthead 254, startsector 37847040, 4096000 sectors, code offset 0x48

文件/目录复制和移动

cp命令

1
2
3
4
5
6
7
8
9
10
11
12
13
cp [-apdriulfs] src dest # 复制单文件或单目录
cp [-apdriuslf] src1 src2 src3......dest_dir # 复制多文件、目录到一个目录下

选项说明:
-p:文件的属性 (权限、属组、时间戳) 也复制过去。如果不指定 -p 选项,谁执行复制动作,文件所有者和组就是谁。
-r 或 -R:递归复制,常用于复制非空目录。
-d:复制的源文件如果是链接文件,则复制链接文件而不是指向的文件本身。即保持链接属性,复制快捷方式本身。如果不指定 -d,则复制的是链接所指向的文件。
-a:a=pdr三个选项。归档拷贝,常用于备份。
-i:复制时如果目标文件已经存在,询问是否替换。
-u:(update)若目标文件和源文件同名,但属性不一样(如修改时间,大小等),则覆盖目标文件。
-f:强制复制,如果目标存在,不会进行-i选项的询问和-u选项的考虑,直接覆盖。
-l:在目标位置建立硬链接,而不是复制文件本身。
-s:在目标位置建立软链接,而不是复制文件本身(软链接相当于windows的快捷方式)。

一般使用cp -a即可,对于目录加上-r选项即可。

注意,bash 内置命令在进行通配符匹配文件的时候,”*“、”?”、”[]” 是无法匹配到以 “.” 开头的文件的,所以 “*“ 不会匹配隐藏文件。要通配隐藏文件,使用 “.” 代替上述几种通配元字符即可,它能匹配除了 “.” 和 “..” 这两个特殊目录外的所有文件。它并非通配符,而是表示当前目录,显然直接复制目录,是可以将隐藏文件复制走的。

例如,复制 /etc/skel 目录下所有文件包括隐藏文件到 /tmp 目录下。

1
cp -a /etc/skel/. /tmp

如果有重复文件,则即使加上 -f 选项,也一样会交互式询问。解决方法可以是使用 “yes” 这个工具,它会不断的生成 y 字母直到进程被杀掉,当然也可以自行指定要生成的字符串。

1
yes | cp -a /etc/skel/. /tmp

scp命令和执行过程分析

scp 是基于 ssh 的安全拷贝命令 (security copy),它是从古老的远程复制命令 rcp 改变而来,实现的是在 host 与 host 之间的拷贝,可以是本地到远程的、本地到本地的,甚至可以远程到远程复制。注意,scp 可能会询问密码。

如果 scp 拷贝的源文件在目标位置上已经存在时 (文件同名),scp 会替换已存在目标文件中的内容,但保持其 inode 号。

如果 scp 拷贝的源文件在目标位置上不存在,则会在目标位置上创建一个空文件,然后将源文件中的内容填充进去。

之所以解释上面的两句,是为了理解 scp 的机制,scp 拷贝本质是只是填充内容的过程,它不会去修改目标文件的很多属性,对于从远程复制到另一远程时,其机制见后文。

1
2
3
4
5
6
7
8
9
10
11
12
scp [-12BCpqrv] [-l limit] [-o ssh_option] [-P port] [[user@]host1:]file1 ... [[user@]host2:]file2

选项说明:
-1:使用ssh v1版本,这是默认使用协议版本
-2:使用ssh v2版本
-C:拷贝时先压缩,节省带宽
-l limit:限制拷贝速度,Kbit/s.
-o ssh_option:指定ssh连接时的特殊选项,一般用不上。偶尔在连接过程中等待提示输入密码较慢时,可以设置GSSAPIAuthentication为no
-P port:指定目标主机上ssh端口,大写的字母P,默认是22端口
-p:拷贝时保持源文件的 mtime,atime,owner,group,privileges
-r:递归拷贝,用于拷贝目录。注意,scp拷贝遇到链接文件时,会拷贝链接的源文件内容填充到目标文件中 (scp的本质就是填充而非拷贝)
-v:输出详细信息,可以用来调试或查看scp的详细过程,分析scp的机制

示例:

  1. 把本地文件 /home/a.tar.tz 拷贝到远程服务器 192.168.0.2 上的 /home/tmp,连接时使用远程的 root 用户
1
scp /home/a.tar.tz root@192.168.0.2:/home/tmp/
  1. 目标主机不写路径时,表示拷贝到对方的家目录下
1
scp /home/a.tar.tz root@192.168.0.2
  1. 把远程文件 /home/a.tar.gz 拷贝到本机
1
2
3
4
5
# 不接本地目录表示拷贝到当前目录
scp root@192.168.0.2:/home/a.tar.tz

# 拷贝到本地/tmp目录下
scp root@192.168.0.2:/home/a.tar.tz /tmp
  1. 拷贝远程机器的 /home/ 目录到本地 /tmp 目录下
1
scp -r root@192.168.0.2:/home/ /tmp
  1. 从远程主机 192.168.100.60 拷贝文件到另一台远程主机 192.168.100.62 上
1
scp root@192.168.100.60:/tmp/copy.txt root@192.168.100.62:/tmp

在远程复制到远程的过程中,例如在本地执行 scp 命令将 A 主机 (192.168.100.60) 上的 /tmp/copy.txt 复制到 B 主机 (192.168.100.62) 上的 /tmp 目录下,如果使用 -v 选项查看调试信息的话,会发现它的步骤类似是这样的。

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
# 以下是从结果中提取的过程

# 首先输出本地要执行的命令
Executing: /usr/bin/ssh -v -x -oClearAllForwardings yes -t -l root 192.168.100.60 scp -v /tmp/copy.txt root@192.168.100.62:/tmp

# 从本地连接到 A 主机
debug1: Connecting to 192.168.100.60 [192.168.100.60] port 22.
debug1: Connection established. 
# 要求验证本地和 A 主机之间的连接
debug1: Next authentication method: password
root@192.168.100.60's password:
# 将 scp 命令行修改后发送到 A 主机上
debug1: Sending command: scp -v /tmp/copy.txt root@192.168.100.62:/tmp
# 在 A 主机上执行 scp 命令
Executing: program /usr/bin/ssh host 192.168.100.62, user root, command scp -v -t /tmp
# 验证 A 主机和 B 主机之间的连接
debug1: Next authentication method: password
root@192.168.100.62's password:
# 从 A 主机上拷贝源文件到最终的 B 主机上
debug1: Sending command: scp -v -t /tmp
Sending file modes: C0770 24 copy.txt
Sink: C0770 24 copy.txt
copy.txt 100% 24 0.0KB/s 
# 关闭本地主机和 A 主机的连接
Connection to 192.168.100.60 closed.

也就是说,远程主机 A 到远程主机 B 的复制,实际上是将 scp 命令行从本地传递到主机 A 上,由 A 自己去执行 scp 命令。也就是说,本地主机不会和主机 B 有任何交互行为,本地主机就像是一个代理执行者一样,只是帮助传送 scp 命令行以及帮助显示信息。

其实从本地主机和主机 A 上的~/.ssh/know_hosts文件中可以看出,本地主机只是添加了主机 A 的信息,并没有添加主机 B 的信息,而在主机 A 上则添加了主机 B 的信息。

mv命令

mv命令移动文件和目录,还可以用于重命名文件或目录。

1
2
3
4
5
6
7
8
9
10
11
mv [-iuf] src dest # 移动单个文件或目录
mv [-iuf] src1 src2 src3 dest_dir # 移动多个文件或目录

选项说明:
--backup[=CONTROL]:如果目标文件已存在,则对该文件做一个备份,默认备份文件是在文件名后加上波浪线,如/b.txt~
-b:类似于--backup,但不接受参数, 默认备份文件是在文件名后加上波浪线,如/b.txt~
-f:如果目标文件已存在,则强制覆盖文件
-i:如果目标文件已存在,则提示是否要覆盖,这是alias mv的默认选项
-n:如果目标文件已存在,则不覆盖已存在的文件
    如果同时指定了-f/-i/-n,则后指定的生效
-u:(update)如果源文件和目标文件不同,则移动,否则不移动

mv 默认已经是递归移动, 不需要 -r 参数。

mv的一个经典问题(mv的本质)

该问题涉及文件系统操作文件的机制,若不理解,请先深入学习文件系统

mv不能实现里层同名目录覆盖外层同名目录。如 /tmp 下有 a 目录,a 目录里还有 a 目录,将不能实现/tmp/a/a 移动到/tmp。

1
2
3
4
5
6
7
8
9
[root@toystory tmp]# tree -L 3 a -fC
a
└── a/a
├── a/a/a
2 directories, 1 file

[root@toystory tmp]# mv a/* .
mv: overwrite `./a'? y
mv: cannot move `a/a'
to `./a': Directory not empty
1
2
[root@toystory tmp]# mv -f /tmp/a/* /tmp
mv: cannot move `/tmp/a/a' to `/tmp/a': Directory not empty

要解释为何会如此,先说明移动和覆盖动作的本质。

同文件系统下移动文件实际上是修改目标文件所在目录的 data block,向其中添加一行指向 inode table 中待移动文件的 inode 的指针,如果目标路径下有同名文件,则会提示是否覆盖,实际上是覆盖指向该同名文件的 inode 指针,由于同名文件的 inode 记录指针被覆盖,就无法再找到该文件的 data block,所以该文件被标记为删除。

跨文件系统移动文件的本质:如果目标路径下没有同名文件,则先为此文件分配一个 inode 号,并在目标目录的 data block 中添加一条指向该 inode 号的新记录 (是全新的),然后将文件复制到目标位置,复制成功则删除源文件,复制失败则保留源文件;如果目标路径下有同名文件,则提示是否要覆盖,如果选择覆盖,则将该同名文件的 inode 指针指向新分配的 inode 号,然后将文件复制到目标位置,复制成功则删除源文件,复制失败则保留源文件。

也就是说,同文件系统下移动文件时,inode 记录不变 (如 inode 号),当然,时间戳是一定会改变的,因为移动过程中修改了 inode 指向 data block 的指针。而跨文件系统下移动文件时,inode 记录完全改变,它是新添加的记录。

再考虑上面的问题,同文件系统下移动文件时先在目标位置 /tmp 的 data block 中添加一条记录,如果同名则提示覆盖,覆盖时会先删除 /tmp 的 data block 中的 a 对应的记录,再添加将要移动文件的记录。从上面的结果也可以看出是先提示覆盖再提示目录非空的错误。

设想下,如果 /tmp/a/a 移动到 /tmp 下并重命名为 b,则其动作是直接向 /tmp 的 data block 中添加 b 的记录,如果此时正好 /tmp 下已有 b 目录,则先删除 /tmp 的 data block 中 b 目录对应的记录,再添加移动后的 b 记录。

但是现在不是重命名为 b,而是覆盖 /tmp/a,此时的动作按原理应该是先提示是否覆盖,如果是,则删除 /tmp 的 data block 中 a 对应的记录,但由于此时 /tmp/a 目录中还有文件,该记录无法删除 (因为如果要删除了该记录,代表删除了 /tmp/a 整个目录,而删除整个 /tmp/a 目录需要删除里面所有的文件,在删除它们之前的一个动作是把 /tmp/a 中的所有目录和文件的 inode 号标记为未使用,但此刻要移动的源目录 /tmp/a/a 是在使用当中的),所以提示目录非空而无法删除,这里所指的非空目录指的是 /tmp/a,而非是 /tmp/a/a 非空。

但是在 Windows 操作系统下,里层目录是可以直接覆盖外层同名目录的,这和文件系统的行为有关。

其实在这个问题中,可以看出 mv 的很多原理。

查看文件内容

cat 命令

输出一个或多个文件的内容。

1
2
3
4
5
6
7
8
cat [OPTION]... [FILE]...

选项说明
-n:显示所有行的行号
-b:显示非空行的行号
-E:在每行行尾加上 $ 符号
-T:将 TAB 符号输出为 "^I"
-s:压缩连续空行为单个空行

cat 还有一个重要功能,允许将分行键入的内容输入到一个文件中去。

首先测试<<eof,这表示将键入的内容追加到标准输入 stdin 中 (不是从标准输入中读取), eof 可以随便使用其他符号代替。

1
2
3
4
[root@xuexi tmp]# cat <<eof
> abc.com
> eof
abc.com

再测试< eof,发现没有输入的机会,并且此时只能使用 eof 作为符号,EOF 或其他任何都不可以。因为<eof是读取标准输入,会将 eof 当成输入文件处理。所以一定要使用<<eof,这表示 here document,而两个 eof 正是 document 的起始和结束标志。

1
[root@xuexi tmp]# cat <eof
1
2
3
4
5
[root@xuexi tmp]# cat <eox
-bash: eox: No such file or directory

[root@xuexi tmp]# cat <EOF
-bash: EOF: No such file or directory

再进一步测试<<eof的功能,将键入的内容重定向到文件而非标准输入中。这时有两种书写方案:

第一种方案:>>filename<<eof>filename<<eof

1
2
3
4
5
[root@xuexi ~]# cat >>/tmp/test.txt<<EOF # 输入到这里按回车键继续输入下一行
> xxxxxxxxxxxxxx # 按回车输入下一行
> yyyyy # 按回车输入下一行
> zz # 按回车输入下一行
> EOF # 顶格写EOF结束输入

第二种方案:<<eof>filename<<eof>>filename

1
2
3
[root@xuexi tmp]# cat <<eof>log.txt
> abc.com
> eof

两种方案结果是一样的,且总是使用<<eof,只不过所写的位置不同而已,不管写在哪个位置,它都表示将键入的内容追加到标准输入。然后再使用>filename>>filename控制重定向的方式,将标准输入中的内容重定向到 filename 文件中。

tac

tac 和 cat 字母正好是相反的,其作用也是和 cat 相反的,它会反向输出行,将最后一行放在第一行的位置输出,依此类推。但是,tac 没有显示行号的参数。

1
2
3
4
5
6
shell> echo -e '1\n2\n3\n4\n5' | tac
5
4
3
2
1

head 打印前面的几行。

1
2
3
4
head [-n num] | [-num] [-v] filename

-n:显示前num行;如果num是负数,则显示除了最后|num|(绝对值)行的其余所有行,即显示前 "总行数-|num|"
-v:会显示出文件名

-n num是显示文件的前 num 行,num 可以是+/-或不加正负号的整数,如果是正整数或不写 + 号,则显示前 num 行。如果是负整数,则从后向前数 num 行,并打印除了这些行的前面所有的行,即打印除了最后 num 行的所有行,也即总行数减 num 的前正数行。不写 -n 时默认是前 10 行。正整数时-n num可以直接简写-num

不管怎么样,它取的都是前几行,哪怕是负整数也是前几行。

示例:

1
2
3
4
5
6
7
8
9
10
11
12
# 取出默认前10行,但总共才有5行
[root@xuexi ~]# echo -e '1\n2\n3\n4\n5' | head
1
2
3
4
5

# 取出前2行
[root@xuexi ~]# echo -e '1\n2\n3\n4\n5' | head -2
1
2

或者

1
2
3
4
5
6
7
8
9
10
11
# 取出前2行
[root@xuexi ~]# echo -e '1\n2\n3\n4\n5' | head -n 2
1
2

# 取出前5-1=4行
[root@xuexi ~]# echo -e '1\n2\n3\n4\n5' | head -n -1
1
2
3
4

tail

tail 和 head 相反,是显示后面的行,默认是后 10 行。

1
2
3
4
5
6
7
tail [OPTION]... [FILE]...

选项说明:
-n:输出最后num行,如果使用-n +num则表示输出从第num行开始的所有行
-f:监控文件变化
--pid=PID:和-f一起使用,在给定PID的进程死亡后,终止文件监控
-v:显示文件名

-n -num-num-n num(num 为正整数) 表示输出最后的 num 行。使用-n +num(num 为正整数) 则表示输出从第 num 行开始的所有行。

1
2
3
4
5
6
7
8
9
10
11
12
# 等价于 tail -n 3和tail -n -3
[root@xuexi ~]# echo -e '1\n2\n3\n4\n5' | tail -3
3
4
5

# 打印除了前3-1=2行的所有行
[root@xuexi tmp]# seq 6 | tail -n +3
3
4
5
6

tail 还有一个重要的参数 -f,监控文件的内容变化。当一个用户不断修改某个文件的尾部,另一个用户就可以通过这个命令来刷新并显示这些修改后的内容。

nl

以行号的方式查看内容。

常用-b a,表示不论是否空行都显示行号,等价于cat -n。不写选项时,默认-b t,表示空行不显示行号,等价于cat -b

1
2
3
4
5
6
7
8
9
# 默认空行不显示行号
[root@xuexi ~]# nl /etc/issue
1 CentOS release 6.6 (Final)
2 Kernel \r on an \m

[root@xuexi ~]# nl -b a /etc/issue
1 CentOS release 6.6 (Final)
2 Kernel \r on an \m
3

more 和 less

按页显示文件内容。使用 more 时,使用/搜索字符串,按下 n 或 N 键表示向下或向上继续搜索。使用 less 时,还多了一个搜索功能,使用?搜索字符串,同样,使用 n 或 N 键可以向上或向下继续搜索。

比较文件内容

1
2
shell> diff file1 file2
shell> vimdiff file1 file2

文件查找类命令

搜索文件的路径在何处以及文件的名称为何。

which

显示命令或脚本的全路径,默认也会将命令的别名显示出来。

1
2
3
shell> which mv
alias mv='mv -i'
/bin/mv

whereis

找出二进制文件、源文件和 man 文档文件。

1
2
3
shell> whereis cd

cd: /usr/bin/cd /usr/share/man/man1/cd.1.gz /usr/share/man/man1p/cd.1p.gz /usr/share/man/mann/cd.n.gz

whatis

列出给定命令 (并非一定是命令) 的 man 文档信息。

1
2
3
4
5
shell> whatis passwd

sslpasswd (1ssl) - compute password hashes
passwd (1) - update user's authentication tokens
passwd (5) - password file

根据上面的结果,执行:

1
2
3
man 1 passwd # 获取passwd命令的man文档
man 5 passwd # 获取password文件的man文档,文件类的man文档说明的是该文件中各配置项意义
man sslpasswd # 获取sslpasswd命令的man文档,实际上是openssl passwd的man文档

locate

没什么好说的。

find

内容太多,使用两篇单独的文章解释

文章作者: 骏马金龙
文章链接: http://www.junmajinlong.com/linux/linux_file_cmd/
版权声明: 本博客所有文章除特别声明外,均采用 CC BY-NC-SA 4.0 许可协议。转载请注明来自 骏马金龙