字符编码(英语:Character encoding)、字集码是把字符集中的字符编码为指定集合中某一对象(例如:比特模式、自然数序列、8位组或者电脉冲),以便文本在计算机中存储和通过通信网络的传递。常见的例子包括将拉丁字母表编码成摩斯电码和ASCII。其中,ASCII将字母、数字和其它符号编号,并用7比特的二进制来表示这个整数。通常会额外使用一个扩充的比特,以便于以1个字节的方式存储。

1、查看文件字符编码

###using file command###

[root@ipython report]# file --mime-encoding analysis.csv

analysis.csv: utf-8

###using vim command###

[root@ipython report]# vim analysis.csv

:set fileencoding

fileencoding=utf-8

2、设置文件字符编码

####using iconv command####

syntax:

iconv -f old_encoding -t new_encoding filename

###example###

[root@ipython report]# iconv -f utf-8 -t gbk analysis.csv > new_analysis.csv

###using vim command###

:set fileencoding=gbk

:wq!