linux文件编码格式转换(linux文件编码)
centos查看文本文件的編碼格式?
如果你需要在Linux 中操作windows下的文件 ,那么你可能會經常遇到文件 編碼 轉換的問題。Windows中默認的文件 格式是GBK(gb2312),而Linux 一般都是UTF-8。下面介紹一下,在Linux 中如何查看 文件 的編碼 及如何進行對文件 進行編碼 轉換。
查看 文件 編碼
在Linux 中查看 文件 編碼 可以通過以下幾種方式:
1.在Vim 中可以直接查看 文件 編碼
:set fileencoding
即可顯示文件 編碼 格式。
如果你只是想查看 其它編碼 格式的文件 或者想解決用Vim查看 文件 亂碼的問題,那么你可以在
~/.vimrc 文件 中添加以下內容:
set encoding=utf-8 fileencodings=ucs-bom,utf-8,cp936
這樣,就可以讓vim自動識別文件 編碼 (可以自動識別UTF-8或者GBK編碼 的文件 ),其實就是依照 fileencodings提供的編碼 列表嘗試,如果沒有找到合適的編碼 ,就用latin-1(ASCII)編碼 打開。
2. enca (如果你的系統中沒有安裝這個命令,可以用sudo yum install -y enca 安裝 )查看 文件 編碼
$ enca filename
filename: Universal transformation format 8 bits; UTF-8
CRLF line terminators
需要說明一點的是,enca對某些GBK編碼 的文件 識別的不是很好,識別時會出現:
Unrecognized encoding
文件 編碼 轉換
1.在Vim中直接進行轉換文件 編碼 ,比如將一個文件 轉換成utf-8格式
:set fileencoding=utf-8
2. enconv 轉換文件 編碼 ,比如要將一個GBK編碼 的文件 轉換成UTF-8編碼 ,操作如下
enconv -L zh_CN -x UTF-8 filename
3. iconv 轉換,iconv的命令格式如下:
iconv -f encoding -t encoding inputfile
比如將一個UTF-8 編碼 的文件 轉換成GBK編碼
iconv -f GBK -t UTF-8 file1 -o file2
Linux 文件名編碼轉換
從Linux 往windows拷貝文件 或者從windows往Linux 拷貝文件 ,有時會出現中文文件 名 亂碼的情況,出現這種問題的原因是因為,windows的文件 名 中文編碼 默認為GBK,而Linux 中默認文件 名 編碼 為UTF8,由于編碼 不一致,所以導致了文件 名 亂碼的問題,解決這個問題需要對文件 名 進行轉碼。
在Linux 中專門提供了一種工具convmv進行文件 名 編碼 的轉換 ,可以將文件 名 從GBK轉換 成UTF-8編碼 ,或者從UTF-8轉換 到GBK。
首先看一下你的系統上是否安裝了convmv,如果沒安裝的話用:
yum -y install convmv
安裝。
下面看一下convmv的具體用法:
convmv -f 源編碼 -t 新編碼 文件 名
常用參數:
-r 遞歸處理子文件 夾
--notest 真正進行操作,請注意在默認情況下是不對文件 進行真實操作的,而只是試驗。
--list 顯示所有支持的編碼
--unescap 可以做一下轉義,比如把%20變成空格
比如我們有一個utf8編碼 的文件 名 ,轉換 成GBK編碼 ,命令如下:
convmv -f UTF-8 -t GBK --notest utf8編碼 的文件 名
這樣轉換 以后"utf8編碼 的文件 名 "會被轉換 成GBK編碼 (只是文件 名 編碼 的轉換 ,文件 內容不會發生變化)。
注意:不要在NTFS和FAT文件 系統中使用此命令,否則可能產生意外結果,如果要在Linux 中正確的顯示NTFS和 FAT的中文件名,可以通過mount參數來解決,具體方法查看一下man手冊。
linux查看日志文件編碼格式?
編碼格式一般是utf8或者gb123
linux中轉換windows文件編碼?
查看文件編碼
在Linux中查看文件編碼可以通過以下幾種方式:
1.在Vim中可以直接查看文件編碼
:set fileencoding
即可顯示文件編碼格式。
如果你只是想查看其它編碼格式的文件或者想解決用Vim查看文件亂碼的問題,那么你可以在
~/.vimrc 文件中添加以下內容:
set encoding=utf-8 fileencodings=ucs-bom,utf-8,cp936
這樣,就可以讓vim自動識別文件編碼(可以自動識別UTF-8或者GBK編碼的文件),其實就是依照fileencodings提供的編碼列表嘗試,如果沒有找到合適的編碼,就用latin-1(ASCII)編碼打開。
文件編碼轉換
1.在Vim中直接進行轉換文件編碼,比如將一個文件轉換成utf-8格式
:set fileencoding=utf-8
2. iconv 轉換,iconv的命令格式如下:
iconv -f encoding -t encoding inputfile
比如將一個UTF-8 編碼的文件轉換成GBK編碼
iconv -f GBK -t UTF-8 file1 -o file2
iconv -f gbk -t utf8 linux常用命令.txt > linux常用命令.txt.utf8
文件名編碼轉換:
從Linux 往 windows拷貝文件或者從windows往Linux拷貝文件,有時會出現中文文件名亂碼的情況,出現這種問題的原因是因為,windows的文件名 中文編碼默認為GBK,而Linux中默認文件名編碼為UTF8,由于編碼不一致,所以導致了文件名亂碼的問題,解決這個問題需要對文件名進行轉碼。
在Linux中專門提供了一種工具convmv進行文件名編碼的轉換,可以將文件名從GBK轉換成UTF-8編碼,或者從UTF-8轉換到GBK。
首先看一下你的系統上是否安裝了convmv,如果沒安裝的話用:
yum -y install convmv
安裝。
下面看一下convmv的具體用法:
convmv -f 源編碼 -t 新編碼 文件名
常用參數:
-r 遞歸處理子文件夾
--notest 真正進行操作,請注意在默認情況下是不對文件進行真實操作的,而只是試驗。
--list 顯示所有支持的編碼
--unescap 可以做一下轉義,比如把%20變成空格
比如我們有一個utf8編碼的文件名,轉換成GBK編碼,命令如下:
convmv -f UTF-8 -t GBK --notest utf8編碼的文件名
這樣轉換以后"utf8編碼的文件名"會被轉換成GBK編碼(只是文件名編碼的轉換,文件內容不會發生變化)
linux下怎么改變文件的編碼格式?
1、用VIM查看文件編碼
在Vim 中可以直接查看文件編碼
:set fileencoding
即可顯示文件編碼格式。
2、 改寫~/.vimrc 文件
如果你只是想查看其它編碼格式的文件或者想解決用Vim查看文件亂碼的問題,那么你可以在
~/.vimrc 文件中添加以下內容:
set encoding=utf-8 fileencodings=ucs-bom,utf-8,cp936
這樣,就可以讓vim自動識別文件編碼(可以自動識別UTF-8或者GBK編碼的文件),其實就是依照 fileencodings提供的編碼列表嘗試,如果沒有找到合適的編碼,就用latin-1(ASCII)編碼打開。
3、 用ICONV文件編碼轉換
我們利用iconv工具對文件的編碼進行轉換。
iconv 轉換,iconv的命令格式如下:
iconv -f encoding -t encoding inputfile
比如將一個GBK 編碼的文件轉換成UTF-8編碼
iconv -f GBK -t UTF-8 file1 -o file2
其中的參數的意義表示
-f From 某個編碼
-t To 某個編碼
-o 輸出到文件
4、 通過記事本另存為來改變文件編碼;
既用Windows下的記事本打開,選擇另存為……,改變編碼即可。
eclipse如何設置文件編碼?
1. 修改默認編碼
在菜單導航欄上Window-->Preferences 打開"首選項"對話框,左側導航樹,導航到 General-->Workspace
2. Windows 7平臺默認為GBK,簡體中文操作系統Windows XP、Windows 2000簡體中文的缺省編碼是GB18030,Linux平臺默認為UTF-8
那么在此工作空間中建立的工程編碼是GBK,工程中建立的java文件也是GBK。
可以看到默認的是GBK編碼格式,我們修改為UTF-8編碼格式或者是你需要的編碼格式
點擊Apply,點擊OK.
3. 有的時候我們導入項目文件,并沒有導入到我們的workspace,只是一個引用,這個時候如果有編碼的問題,我們可以修改文件的編碼查看.
在Eclipse項目文件上右鍵,選擇Properties,在Resource選擇修改編碼格式
4. 有時候我們需要某種類型的文件,如:*.jsp、*.java等
導航欄window-->preferences
打開"首選項"對話框,左側導航樹,導航到 Genera-->Content Types
5. 右邊找到要修改的文件的類型,我這邊以*.java為例
在下面的Default encoding,輸入框中輸入UTF-8->Update->OK
6. 在包資源管理器右鍵點擊文件->屬性,改變文本文件編碼格式為UTF-8
7. 經過上述步驟,新建java文件即為UTF-8編碼,新建項目也是UTF-8編碼,在
Eclipse編譯、運行、調試都是沒問題的。
總結
以上是生活随笔為你收集整理的linux文件编码格式转换(linux文件编码)的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: CF1556E-Equilibrium【
- 下一篇: ps6怎么做3d字体(pscs6怎么做3