文件表格乱码怎么回事 (文件表格乱码怎么回事啊)

ANSI字符与字符的转换

电脑

在电脑设计开始,为了能支持多国语言,使用两个字节表示一个字符(可以这样理解,两个16进制的字节,表示一个汉字,比始中国的“中”在计算机真实存在就是 [0xD6,0xD0] 这两个字节存储。

每个国家又制定了不同的标准,由此产生了 GB2312、GBK、GB18030、Big5、Shift_JIS 等各自的编码标准。这些使用多个字节来代表一个字符的各种汉字延伸编码方式,称为 ANSI 编码。在简体中文Windows操作系统中,ANSI 编码代表 GB2312编码;在繁体中文Windows操作系统中,ANSI编码代表Big5;在日文Windows操作系统中,ANSI 编码代表 JIS 编码。

ANSI编码作为中国以及部分亚太地区的多字符编码格式,Windows系统和OS X都是提供原生支持的。

全球通用的是UTF-8编码

windows系统默认是ANSI编码,有时我们因输入法,或从文本文件转入EXCEL的会是乱码;这需要转换一下编码格式:函数:code(); char()提供了简单转换;

比如:=code(b2)就是将b转换成ANSI字符代电脑码98;

电脑

而=CHAR(66)则是得到大写的B

最常见的是CSV文件用EXCEL打开,或文本文件导入EXCEL时出现乱码,就是编码问题造成的,批量转的话可以直接用记事本打开,然后另存为,编码那里选ANSI格式就可以了;

我们做好的excel表格,可能会需要发送给其它国家或地区的人,那这里要注意,对方收到有可能是乱码;就是因为编码格式不同;我们默认是ANSI,需要转换成国际统用编码,

其实也非常简单,另存为时右下角有个工具下拉选 项(以2013版为例),选 web选 项;

然后出现电脑对话框,我们再选择 编码项,找到Unicode(UTF-8)确定后回到另存界面,再保存就可以了;

电脑

这里UTF-8编码,unicode都是国际通用编码,如果对方还乱码,需要对方以他本地区编码再转换一下,从国际通用编码方便转换。

UTF-8是UNICODE的一种变长字符编码又称万国码,由Ken Thompson于1992年创建。现在已经标准化为RFC 3629。UTF-8用1到6个字节编码UNICODE字符。用在网页上可以同一页面显示中文简体繁体及其它语言(如日文,韩文)。

Unicode编码

Unicode(统一码、万国码、单一码)是一种在计算机上使用的字符编码。它为每种语言中的每个字符设定了统一并且唯一的二进制编码,以满足跨语言、跨平台进行文本转换、处理的要求。1990年开始研发,1994年正式公布。随着计算机工作能力的增强,Unicode也在面世以来的十多年里得到普及。

Unicode是国际组织制定的可以容纳世界上所有文字和符号的字符编码方案。Unicode用数字0-0x10FFFF来映射这些字符,最多可以容纳1114112个字符,或者说有1114112个码位。码位就是可以分配给字符的数字。UTF-8、UTF-16、UTF-32都是将数字转换到程序数据的编码方案。


对了,小伙伴们觉得有用的话,请务必关注并收藏呀!后续大明哥持续不断的为大家分享Excel中实用的知识点和技巧。


电脑