ANSI文字和文字转换
计算机设计开始时,为了支持多种语言,使用2字节来表示一个字符(可以这样理解,2个十六进制字节、1个汉字,与开始中国的“中”相比,计算机的实际存在存储在名为[0xD6,0xD0]的2字节中)。
每个国家又制定了不同的标准,由此产生了 GB2312、GBK、GB18030、Big5、Shift_JIS 等各自的编码标准。这些使用多个字节来代表一个字符的各种汉字延伸编码方式,称为 ANSI 编码。在简体中文Windows操作系统中,ANSI 编码代表 GB2312编码;在繁体中文Windows操作系统中,ANSI编码代表Big5;在日文Windows操作系统中,ANSI 编码代表 JIS 编码。
ANSI编码作为中国以及部分亚太地区的多字符编码格式,Windows系统和OS X都是提供原生支持的。
全球通用的是UTF-8编码
windows系统默认是ANSI编码,有时我们因输入法,或从文本文件转入EXCEL的会是乱码;这需要转换一下编码格式:函数:code(); char()提供了简单转换;
比如:=code(b2)就是将b转换成ANSI字符代码98;
而=CHAR(66)则是得到大写的B
最常见的是CSV文件用EXCEL打开,或文本文件导入EXCEL时出现乱码,就是编码问题造成的,批量转的话可以直接用记事本打开,然后另存为,编码那里选ANSI格式就可以了;
我们做好的excel表格,可能会需要发送给其它国家或地区的人,那这里要注意,对方收到有可能是乱码;就是因为编码格式不同;我们默认是ANSI,需要转换成国际统用编码,
其实也非常简单,另存为时右下角有个工具下拉选 项(以2013版为例),选 web选 项;
然后出现对话框,我们再选择 编码项,找到Unicode(UTF-8)确定后回到另存界面,再保存就可以了;
这里UTF-8编码,unicode都是国际通用编码,如果对方还乱码,需要对方以他本地区编码再转换一下,从国际通用编码方便转换。
UTF-8是UNICODE的一种变长字符编码又称万国码,由Ken Thompson于1992年创建。现在已经标准化为RFC 3629。UTF-8用1到6个字节编码UNICODE字符。用在网页上可以同一页面显示中文简体繁体及其它语言(如日文,韩文)。
Unicode编码
Unicode(统一码、万国码、单一码)是一种在计算机上使用的字符编码。它为每种语言中的每个字符设定了统一并且唯一的二进制编码,以满足跨语言、跨平台进行文本转换、处理的要求。1990年开始研发,1994年正式公布。随着计算机工作能力的增强,Unicode也在面世以来的十多年里得到普及。
Unicode是国际组织制定的可以容纳世界上所有文字和符号的字符编码方案。Unicode用数字0-0x10FFFF来映射这些字符,最多可以容纳1114112个字符,或者说有1114112个码位。码位就是可以分配给字符的数字。UTF-8、UTF-16、UTF-32都是将数字转换到程序数据的编码方案。
对了,小伙伴们觉得有用的话,请务必关注并收藏呀!后续大明哥持续不断的为大家分享Excel中实用的知识点和技巧。
1.《excel文档出现乱码怎么办?我来告诉你答案excel出现乱码根本原因及解决方案》援引自互联网,旨在传递更多网络信息知识,仅代表作者本人观点,与本网站无关,侵删请联系页脚下方联系方式。
2.《excel文档出现乱码怎么办?我来告诉你答案excel出现乱码根本原因及解决方案》仅供读者参考,本网站未对该内容进行证实,对其原创性、真实性、完整性、及时性不作任何保证。
3.文章转载时请保留本站内容来源地址,https://www.lu-xu.com/gl/3173707.html