重定向学习 shell -Linux 使用经验集册

这堂课，我们来介绍可能是命令行最酷的特性。它叫做 I/O 重定向。"I/O"代表输入/输出，通过这个工具，你可以重定向命令的输入输出，命令的输入来自文件，而输出也存到文件。也可以把多个命令连接起来组成一个强大的命令管道。为了炫耀这个工具，我们将叙述以下命令：

cat －连接文件
sort －排序文本行
uniq －报道或省略重复行
grep －打印匹配行
wc －打印文件中换行符，字，和字节个数
head －输出文件第一部分
tail - 输出文件最后一部分

标准输入，输出，和错误

到目前为止，我们用到的许多程序都会产生某种输出。这种输出，经常由两种类型组成。第一，程序运行结果；这是说，程序要完成的功能。第二，我们得到状态和错误信息，这些告诉我们程序进展。如果我们观察一个命令，像 ls，会看到它的运行结果和错误信息显示在屏幕上。

与 Unix 主题“任何东西都是一个文件”保持一致，程序，比方说 ls，实际上把他们的运行结果输送到一个叫做标准输出的特殊文件（经常用 stdout 表示），而它们的状态信息则送到另一个叫做标准错误的文件（stderr）。默认情况下，标准输出和标准错误都连接到屏幕，而不是保存到磁盘文件。除此之外，许多程序从一个叫做标准输入（stdin）的设备得到输入，默认情况下，标准输入连接到键盘。

I/O 重定向允许我们可以更改输出走向和输入来向。一般地，输出送到屏幕，输入来自键盘，但是通过 I/O 重定向，我们可以改变输入输出方向。

重定向标准输出

I/O 重定向允许我们来重定义标准输出送到哪里。重定向标准输出到另一个文件除了屏幕，我们使用 ">" 重定向符，其后跟着文件名。为什么我们要这样做呢？因为有时候把一个命令的运行结果存储到一个文件很有用处。例如，我们可以告诉 shell 把 ls 命令的运行结果输送到文件 ls-output.txt 中去，由文件代替屏幕。

[me@linuxbox ~]$ ls -l /usr/bin > ls-output.txt

这里，我们创建了一个长长的目录/usr/bin 列表，并且输送程序运行结果到文件 ls-output.txt 中。我们检查一下重定向的命令输出结果：

[me@linuxbox ~]$ ls -l ls-output.txt
-rw-rw-r-- 1   me   me    167878 2008-02-01 15:07 ls-output.txt

好；一个不错的大型文本文件。如果我们用 less 阅读器来查看这个文件，我们会看到文件 ls-output.txt 的确包含 ls 命令的执行结果。

[me@linuxbox ~]$ less ls-output.txt

现在，重复我们的重定向测试，但这次有改动。我们把目录换成一个不存在的目录。

[me@linuxbox ~]$ ls -l /bin/usr > ls-output.txt
ls: cannot access /bin/usr: No such file or directory

我们收到一个错误信息。这很有意义，因为我们指定了一个不存在的目录/bin/usr, 但是为什么这条错误信息显示在屏幕上而不是被重定向到文件 ls-output.txt？答案是， ls 程序不把它的错误信息输送到标准输出。反而，像许多写得不错的 Unix 程序，ls 把错误信息送到标准错误。因为我们只是重定向了标准输出，而没有重定向标准错误，所以错误信息被送到屏幕。马上，我们将知道怎样重定向标准错误，但是首先看一下我们的输出文件发生了什么事情。

me@linuxbox ~]$ ls -l ls-output.txt
-rw-rw-r-- 1 me   me    0 2008-02-01 15:08 ls-output.txt

文件长度成为零！这是因为，当我们使用 ">" 重定向符来重定向输出结果时，目标文件总是从开头被重写。因为我们 ls 命令没有产生运行结果，只有错误信息，重定向操作开始重写文件，然后由于错误而停止，导致文件内容删除。事实上，如果我们需要删除一个文件内容（或者创建一个新的空文件），可以使用这样的技巧：

[me@linuxbox ~]$ > ls-output.txt

简单地使用重定向符，没有命令在它之前，这会删除一个已存在文件的内容或是创建一个新的空文件。

所以，怎样才能把重定向结果追加到文件内容后面，而不是从开头重写文件？为了这个目的，我们使用">>"重定向符，像这样：

[me@linuxbox ~]$ ls -l /usr/bin >> ls-output.txt

使用">>"操作符，将导致输出结果添加到文件内容之后。如果文件不存在，文件会被创建，就如使用了">"操作符。把它放到测试中：

[me@linuxbox ~]$ ls -l /usr/bin >> ls-output.txt
[me@linuxbox ~]$ ls -l ls-output.txt
-rw-rw-r-- 1 me   me    503634 2008-02-01 15:45 ls-output.txt

我们重复执行命令三次，导致输出文件大小是原来的三倍。

重定向标准错误

重定向标准错误缺乏专用的重定向操作符。重定向标准错误，我们必须参考它的文件描述符。一个程序可以在几个编号的文件流中的任一个上产生输出。然而我们必须把这些文件流的前三个看作标准输入，输出和错误，shell 内部参考它们为文件描述符0，1和2，各自地。shell 提供了一种表示法来重定向文件，使用文件描述符。因为标准错误和文件描述符2一样，我们用这种表示法来重定向标准错误：

[me@linuxbox ~]$ ls -l /bin/usr 2> ls-error.txt

文件描述符"2"，紧挨着放在重定向操作符之前，来执行重定向标准错误到文件 ls-error.txt 任务。

重定向标准输出和错误到同一个文件

可能有这种情况，我们希望捕捉一个命令的所有输出到一个文件。为了完成这个，我们必须同时重定向标准输出和标准错误。有两种方法来完成任务。第一个，传统的方法，在旧版本 shell 中也有效：

[me@linuxbox ~]$ ls -l /bin/usr > ls-output.txt 2>&1

使用这种方法，我们完成两个重定向。首先重定向标准输出到文件 ls-output.txt，然后重定向文件描述符2（标准错误）到文件描述符1（标准输出）使用表示法2>&1。

注意重定向的顺序安排非常重要。标准错误的重定向必须总是出现在标准输出重定向之后，要不然它不起作用。上面的例子，

>ls-output.txt 2>&1

重定向标准错误到文件 ls-output.txt，但是如果命令顺序改为：

2>&1 >ls-output.txt

则标准错误定向到屏幕。

现在的 bash 版本提供了第二种方法，更精简合理的方法来执行这种联合的重定向。

[me@linuxbox ~]$ ls -l /bin/usr &> ls-output.txt

在这个例子里面，我们使用单单一个表示法 &> 来重定向标准输出和错误到文件 ls-output.txt。

处理不需要的输出

有时候“沉默是金”，我们不想要一个命令的输出结果，只想把它们扔掉。这种情况尤其适用于错误和状态信息。系统为我们提供了解决问题的方法，通过重定向输出结果到一个特殊的叫做"/dev/null"的文件。这个文件是系统设备，叫做位存储桶，它可以接受输入，并且对输入不做任何处理。为了隐瞒命令错误信息，我们这样做：

[me@linuxbox ~]$ ls -l /bin/usr 2> /dev/null

Unix 文化中的/dev/null

位存储桶是个古老的 Unix 概念，由于它的普遍性，它的身影出现在 Unix 文化的许多部分。当有人说他/她正在发送你的评论到/dev/null，现在你应该知道那是什么意思了。更多的例子，可以阅读 Wikipedia 关于"/dev/null"的文章。

重定向标准输入

到目前为止，我们还没有遇到一个命令是利用标准输入的（实际上我们遇到过了，但是一会儿再揭晓谜底），所以我们需要介绍一个。

cat －连接文件

cat 命令读取一个或多个文件，然后复制它们到标准输出，就像这样:

cat [file]

在大多数情况下，你可以认为 cat 命令相似于 DOS 中的 TYPE 命令。你可以使用 cat 来显示文件而没有分页，例如：

[me@linuxbox ~]$ cat ls-output.txt

将会显示文件 ls-output.txt 的内容。cat 经常被用来显示简短的文本文件。因为 cat 可以接受不只一个文件作为参数，所以它也可以用来把文件连接在一起。比方说我们下载了一个大型文件，这个文件被分离成多个部分（USENET 中的多媒体文件经常以这种方式分离），我们想把它们连起来。如果文件命名为：

我们能用这个命令把它们连接起来：

cat movie.mpeg.0* > movie.mpeg

因为通配符总是以有序的方式展开，所以这些参数会以正确顺序安排。

这很好，但是这和标准输入有什么关系呢？没有任何关系，让我们试着做些其他的工作。如果我们输入不带参数的"cat"命令，会发生什么呢：

[me@linuxbox ~]$ cat

没有发生任何事情，它只是坐在那里，好像挂掉了一样。看起来是那样，但是它正在做它该做的事情：

如果 cat 没有给出任何参数，它会从标准输入读入数据，因为标准输入，默认情况下，连接到键盘。它正在等待我们输入数据！试试这个：

[me@linuxbox ~]$ cat
The quick brown fox jumped over the lazy dog.

下一步，输入 Ctrl-d（按住 Ctrl 键同时按下"d"），来告诉 cat，在标准输入中，它已经到达文件末尾（EOF）：

[me@linuxbox ~]$ cat
The quick brown fox jumped over the lazy dog.

由于文件名参数的缺席，cat 复制标准输入到标准输出，所以我们看到文本行重复出现。我们可以使用这种行为来创建简短的文本文件。比方说，我们想创建一个叫做"lazy_dog.txt" 的文件，这个文件包含例子中的文本。我们这样做：

[me@linuxbox ~]$ cat > lazy_dog.txt
The quick brown fox jumped over the lazy dog.

输入命令，其后输入要放入文件中的文本。记住，最后输入 Ctrl-d。通过使用这个命令，我们实现了世界上最低能的文字处理器！看一下运行结果，我们使用 cat 来复制文件内容到标准输出：

[me@linuxbox ~]$ cat lazy_dog.txt
The quick brown fox jumped over the lazy dog.

现在我们知道怎讲接受标准输入，除了文件名参数，让我们试着重定向标准输入：

[me@linuxbox ~]$ cat < lazy_dog.txt
The quick brown fox jumped over the lazy dog.

使用“<”重定向操作符，我们把标准输入源从键盘改到文件 lazy_dog.tx。我们看到结果和传递单个文件名作为参数的执行结果一样。把这和传递一个文件名参数作比较，尤其没有意义，但它是用来说明把一个文件作为标准输入源。

在我们继续之前，查看 cat 的手册页，因为它有几个有趣的选项。

管道线

命令可以从标准输入读取数据，然后再把数据输送到标准输出，命令的这种能力被一个 shell 特性所利用，这个特性叫做管道线。使用管道操作符"|"（竖杠），一个命令的标准输出可以管道到另一个命令的标准输入：

command1 | command2

为了全面地说明这个命令，我们需要一些命令。是否记得我们说过，我们已经知道有一个命令接受标准输入？它是 less 命令。我们用 less 来一页一页地显示任何命令的输出，命令把它的运行结果输送到标准输出：

[me@linuxbox ~]$ ls -l /usr/bin | less

这极其方便！使用这项技术，我们可以方便地检测会产生标准输出的任一命令的运行结果。

过滤器

管道线经常用来对数据完成复杂的操作。有可能会把几个命令放在一起组成一个管道线。通常，以这种方式使用的命令被称为过滤器。过滤器接受输入，以某种方式改变它，然后输出它。第一个我们想试验的过滤器是 sort。想象一下，我们想把目录/bin 和/usr/bin 中的可执行程序都联合在一起，再把它们排序，然后浏览执行结果：

[me@linuxbox ~]$ ls /bin /usr/bin | sort | less

因为我们指定了两个目录（/bin 和/usr/bin），ls 命令的输出结果由有序列表组成，各自针对一个目录。通过在管道线中包含 sort，我们改变输出数据，从而产生一个有序列表。

uniq - 报道或忽略重复行

uniq 命令经常和 sort 命令结合在一起使用。uniq 从标准输入或单个文件名参数接受数据有序列表（详情查看 uniq 手册页），默认情况下，从数据列表中删除任何重复行。所以，为了确信我们的列表中不包含重复句子（这是说，出现在目录/bin 和/usr/bin 中重名的程序），我们添加 uniq 到我们的管道线中：

[me@linuxbox ~]$ ls /bin /usr/bin | sort | uniq | less

在这个例子中，我们使用 uniq 从 sort 命令的输出结果中，来删除任何重复行。如果我们想看到重复的数据列表，让 uniq 命令带上"-d"选项，就像这样：

[me@linuxbox ~]$ ls /bin /usr/bin | sort | uniq -d | less

wc －打印行，字和字节数

wc（字计数）命令是用来显示文件所包含的行，字和字节数。例如：

[me@linuxbox ~]$ wc ls-output.txt
7902 64566 503634 ls-output.txt

在这个例子中，wc 打印出来三个数字：包含在文件 ls-output.txt 中的行数，单词数和字节数，正如我们先前的命令，如果 wc 不带命令行参数，它接受标准输入。"-l"选项限制命令输出只能报道行数。添加 wc 到管道线来统计数据，是个很便利的方法。查看我们的有序列表中程序个数，我们可以这样做：

[me@linuxbox ~]$ ls /bin /usr/bin | sort | uniq | wc -l
2728

grep －打印匹配行

grep 是个很强大的程序，用来找到文件中的匹配文本。这样使用 grep 命令：

grep pattern [file...]

当 grep 遇到一个文件中的匹配"模式"，它会打印出包含这个类型的行。grep 能够匹配的模式可以很复杂，但是现在我们把注意力集中在简单文本匹配上面。在后面的章节中，我们将会研究高级模式，叫做正则表达式。

比如说，我们想在我们的程序列表中，找到文件名中包含单词"zip"的所有文件。这样一个搜索，可能让我们了解系统中的一些程序与文件压缩有关系。这样做：

[me@linuxbox ~]$ ls /bin /usr/bin | sort | uniq | grep zip
bunzip2
bzip2
gunzip
...

grep 有－对方便的选项："-i"导致 grep 忽略大小写当执行搜索时（通常，搜索是大小写敏感的），"-v"选项会告诉 grep 只打印不匹配的行。

head / tail －打印文件开头部分/结尾部分

有时候你不需要一个命令的所有输出。可能你只想要前几行或者后几行的输出内容。 head 命令打印文件的前十行，而 tail 命令打印文件的后十行。默认情况下，两个命令都打印十行文本，但是可以通过"-n"选项来调整命令打印的行数。

重定向

在这篇文章中：