textbox

IT博客 联系 聚合 管理
  103 Posts :: 7 Stories :: 22 Comments :: 0 Trackbacks

刚接触sed命令真是要命。试图在它的命令行内找一些规则。让人深深的感觉到linux 不适合外行人用的原因。说真的一个命令搞得如此的复杂真是大大的提高了它的学习门槛。牢骚废话少了既然自己选择的路就要自己坚持的走下去。
下面是一些学习笔记。

何时使用 sed
在修改文件时 , 如果不断地重覆某些编辑动作 , 则可用 sed 自动一次执行这些编辑动作。例如要使 received
档内 1000 封电子信件内的发信人属名 "Tom" 改成 "John" , 此时只要在命令列上执行一简单的 sed 命令就可
把档内所有的 "Tom" 字串替换成 "Joh“ 等等


sed 的功能

sed 可删除(delete)、改变(change)、添加(append)、插入(insert)、合、交换文件中的资料行 , 或读入其它
档的资料到文件中 , 也可替换(substuite)它们其中的字串、或转换(tranfer)其中的字母等等。例如将文件中的
连续空白行删成一行、 "local" 字串替换成 "remote" 、"t" 字母转换成 "T"、将第 10 行资料与第 11 资料合
等。


sed工作原理
当 sed 由标准输入读入一行资料并放入 pattern space 时 , sed 依照 sed script 的编辑指令逐一对 pattern space 内的资料执行编辑 , 之後 , 再由 pattern space 内的结果送到标准输出 , 接着再将下一行资
料读入。如此重执行上述动作 , 直至读完所有资料行为止。


sed 组成
Sed 命令列可分成编辑指令文件档部份。其中 , 编辑指令负责控制所有的编辑工作 ; 文件档表示所处理的档案。
sed 的编辑指令均由位址(address)与函数(function)两部份组成 , 其中 , 在执行时 , sed 利用它的位址参数来 决定编辑的对象;而用它的函数参数(解[3])编辑。


sed运行环境
sed 编辑指令 , 除了可在命令列上执行 , 也可在档案内执行。其中差别只是在命令列上执行时 , 其前必须加上选项 -e ; 而在档案内时 , 则只需在其档名前加上选项 -f。另外 , sed 执行编辑指令是依照它
们在命令列上或档内的次序。



执行命令列上的编辑指令
格式:sed -e '编辑指令1' -e '编辑指令2' ... 文件档

备注:所有编辑指令都紧接在选项 -e 之後 , 并置於两个 " ' " 特殊字元间。另外 , 命令上编辑指令的执行是由 左而右。


例如 , 删除 yel.dat 内 1 至 10 行资料 , 并将其余文字中的 "yellow" 字串改成 "black" 字串。此时 , 可将编辑指令直接在命令上执行 , 其命令如下 :
sed -e '1,10d' -e 's/yellow/black/g' yel.dat
在命令中 , 编辑指令 '1,10d'执行删除 1 至 10 行资料 ; 编辑指令 's/yellow/black/g' 执行"yellow" 字串替换成 "black" 字串。
下面这句是来自 LinuxSir.Org  LFS 里的一句:
sed 's@\./fixinc\.sh@-c true@' gcc/Makefile.in.orig > gcc/Makefile.in

编辑指令
编辑指令的格式如下 :
[address1[,address2]] function [argument]
位址参数 address1 、address2 为行数或 regular expression 字串 , 表示所执行编辑的资料行 ();
功能参数是function[argument] 为 sed 的内定函数 , 表示执行的编辑动作动作
可以理解成:找到符合匹配的(源)行执行编辑动作,匹配是使用正则表达式来匹配。

例如一下一些编辑命令:
10,200d  -----------删除档内第 10 行到第 200 行资料 位址参数是 :10,200; 功能参数是d
10,/man/d----------删除档内第 10 行到含 "man" 字串的资料行 位址参数是 :10,/man/; 功能参数是d
10d------------------删除档内第 10 行 位址参数是 :10; 功能参数是d
 /apple/,/orange/d 删除资料区 , 由档内含有 "apple" 字串至含有 "orange" 字串的资料行 位址参数是 :/apple/ ,/orange/; 功能参数是d

源的选择来自位置参数,执行的动作来自函数参数那有多少函数参数就说明sed有多少功能。
一下是函数参数:

{ } 集合有相同位址参数的指令
! 不执行函数参数
= 印出资料行数( line number )
a\ 添加使用者输入的资料
b label 将执行的指令跳至由 : 建立的参考位置
c\ 以使用者输入的资料取代资料
d 删除资料。
D 删除 pattern space 内第一个 newline 字母 \ 前的资料
g 拷贝资料从 hold space
G 添加资料从 hold space 至 pattern space
h 拷贝资料从 pattern space 至 hold space
H 添加资料从 pattern space 至 hold space
l 印出 l 资料中的 nonprinting character 用 ASCII 码
i\ 插入添加使用者输入的资料行
n 读入下一笔资料
N 添加下一笔资料到 pattern space
p 印出资料
P 印出 pattern space 内第一个 newline 字母 \ 前的资料
q 跳出 sed 编辑
r 读入它档内容
s 替换字串
t label 先执行一替换的编辑指令 , 如果替换成牛p>则将编辑指令跳至 : label 处执行
w 写资料到它档内。
x 交换 hold space 与 pattern space 内容
y 转换(transform)字元
虽然 , sed 只有上表所述几个拥有基本编辑功能的函数 , 但由指令中位址参数和指令与指令间的配合 , 也能使sed 完成大部份的编辑任务。


执行档案内的编辑指令
当执行的指令太多 , 在命令列上撰写起来十分混乱 , 此时 , 可将这些指令整理储存在档案(譬如档名为 script_file )内 , 用选项 -f script_file , 则让 sed 执行 script_file 内的编辑指令。其命
令的格示如下 :
sed -f script_file 文件档

其中 , 执行 script_file 内编辑指令的顺序是由上而下。例如上一节的例子 , 其可改成如下命令:
sed -f ysb.scr yel.dat

其中 , ysb.scr 档的内容如下 :
1,10d
s/yellow/black/g

另外 , 在命令列上可混合使用选项 -e 与 -f , sed 执行指令顺序依然是由命令列的左到右,如执行至 -f 後 档案内的指令 , 则由上而下执行。

执行多个文件档的编辑
在 sed 命令列上 , 一次可执行编辑多个文件档 , 它们跟在编辑指令之後。例如 , 替换
white.dat、red.dat、black.dat 档内的 "yellow" 字串成 "blue" , 其命令如下:
sed -e 's/yellow/blue/g' white.dat red.dat black.dat

上述命令执行时 , sed 依 white.dat、red.dat、black.dat 顺序 , 执行编辑指令 s/yellow/blue/(请参照[section 4.1] , 进行字串的替换。

执行输出的控制
在命令列上的选项 -n (解[7]) 表示输出由编辑指令控制。由前章内容得知 , sed 会 "自动的" 将资料由 pattern space 输送到标准输出档。但藉着选项 -n , 可将 sed 这 "自动的" 的动作改成 "被动的" 由它所执行的编辑指令(解[8])来决定结果是否输出。由上述可知 , 选项 -n 必须与编辑指令一起配合 , 否则无法获得结果。例如 , 印出 white.dat 档内含有 "white"字串的资料行 , 其命令如下:

sed -n -e '/white/p' white.dat

上面命令中 , 选项 -n 与编辑指令 /white/p (参照[section4.6]) 一起配合控制输出。其中 , 选项 -n 将输出控制权移给编辑指令;/white/p 将资料行中含有 "white" 字串印出萤幕。



posted on 2009-12-02 16:26 零度 阅读(728) 评论(0)  编辑 收藏 引用 所属分类: Linux
只有注册用户登录后才能发表评论。