工作中,常需要把Linux上的文件拿到Windows下,也常把Windows下的文件拿到Linux下。其中就遇到些文件格式上的问题。今天在网上搜了一些,选了一篇较经典的转载如下:
原文名:DOS文件转换成UNIX文件格式详解
dos格式文件传输到unix系统时,会在每行的结尾多一个^M,当然也有可能看不到,但是在vi的时候,会在下面显示此文件的格式,比如 "dos.txt" [dos] 120L, 2532C 字样,表示是一个[dos]格式文件,如果是MAC系统的,会显示[MAC],因为文件格式的原因有时会导致我们的unix程序,或者shell程序出现错误,那么需要把这些dos文件格式转换成unix格式,方法是
vi dos.txt :set fileformat=unix :w
这样文件就转换成unix格式文件了, 一般在windows机器上编写好了文件传到unix下就可能会出现这样的情况.
用命令:"set ff?”可以看到dos或unix的字样.用:"set ff=unix"把它强制为unix格式,也可以用sed 这样的工具来做: "sed 's/^M//' filename > tmp_filename" 其中^M是同时Ctrl+V+M按出来的,表示回车。其它“怪招”:
1. 使用vi vi dos_file.txt :%s/^M//g 其中^M 必须是同时按 Ctrl+V+M ,表示回车。不是直接输入 ^M ,那没有用的, :-) 。
2. 使用tr 命令:tr -d "\015" dos_file.txt
3. 使用perl cat dos_file.txt | perl -pe '~s/\r//g' > dos_file.txt
【VIM】DOS、Mac 和 Unix 文件
http://vimcdoc.sourceforge.net/doc/usr_23.html
很久以前,老式的电传打字机使用两个字符来另起新行。一个字符把滑动架移回首位 (称为回车,<CR>
),另一个字符把纸上移一行 (称为换行,<LF>
)。 当计算机问世以后,存储器曾经非常昂贵。有些人就认定没必要用两个字符来表示行尾。UNIX 开发者决定他们可以用 <Line Feed>
一个字符来表示行尾。Apple 开发者规定了用 <CR>
。开发 MS-DOS (以及微软视窗) 的那些家伙则决定沿用老式的 <CR>
<LF>
。 那意味着,如果你试图把一个文件从一种系统移到另一种系统,那么你就有换行符方面的麻烦。Vim 编辑器自动识别不同文件格式,并且不劳你操心就把事情给办妥了。选项 'fileformats' 包含各种各样的格式,Vim 会在编辑一个新文件之初尝试该选项定义的各种格式。例如,下面这个命令告诉 Vim 先尝试用 UNIX 格式,其次,尝试MS-DOS 格式:
:set fileformats=unix,dos
编辑一个文件时,你将注意
到 Vim 给出的信息消息报中包括文件所用的格式。如果你编辑的是本地格式文件 (你编辑的文件格式和所用系统一致),你就不会看到任何格式名。因此在 Unix 系统上编辑一个 Unix 格式文件不会产生任何关于格式的信息。但你若编辑一个 dos 文件,Vim 将这样通知你:
"/tmp/test" [dos] 3L,71C
如果是 Mac 文件,你会看到 "[mac]",探测到的文件格式会被存入 'fileformat' 选项。执行下面这个命令可以显示你当前使用的文件格式:
:set fileformat?
Vim 能使用的三种格式如下:
unix <LF>
dos <CR>
<LF>
mac <CR>
使 用 MAC 格 式
在 Unix 上,<LF>
用于分行。但 <CR>
字符混在文本行中间也非罕见。这种情况碰巧经常发生在 Vi (和 Vim) 脚本内。 在采用 <CR>
作为换行符的 Macintosh 上,<LF>
字符也有可能混在文本行中间。 结果,很难 100% 肯定一个同时包含 <CR>
和 <LF>
的文件究竟是 Mac 还是 Unix 格式。所以,Vim 假设你一般不会在 Unix 上编辑一个 Mac 文件,所以干脆对这种文件格式不作检查。果真要检查此种格式,就把 "mac" 加入 'fileformats':
:set fileformats+=mac
然后 Vim 就会猜测文件格式。要当心, Vim 可能会猜错的。
强 制 格 式
如果你用往日美好的 Vi 来尝试编辑一个采用 MS-DOS 格式的文件,你将会发现每一行的末尾有个 ^M 字符。(^M 就是 <CR>
)。而 Vim 的自动探测功能就避免了这个问题。莫非你确实要按那个样子来编辑这个文件吗?那么你需要强制 Vim 忽略文件格式而使用你指定的格式:
:edit ++ff=unix file.txt
字符串 "++" 告诉 Vim 后面跟的是选项名,以取代其默认值。但仅作用于这一个命令。"++ff" 用于 'fileformat' 选项。你也可以用 "++ff=mac" 或 "++ff=dos"。这样用法并非适用于任意选项,目前 Vim 仅仅实现了 "++ff" 和 "++enc"。用全称"++fileformat" 和 "++encoding" 也行。
转 换
你可以用 'fileformat' 选项把文件从一种格式转换为另一种。例如,假定你有个名为README.TXT 的 MS-DOS 文件,你要把它转换成 UNIX 格式。首先编辑这个采用 MS-DOS格式的文件:
vim README.TXT
Vim 将识别出那是一个 dos 格式文件。现在把这个文件的格式改为 UNIX:
:set fileformat=unix
:write
这个文件就以 Unix 格式存盘了。
posted on 2009-09-22 14:32
小胡子 阅读(480)
评论(0) 编辑 收藏 引用 所属分类:
技术知识