unicode字符 ASCII编码和Unicode编码

　　计算机是以二进制的形式来存储数据的，它只认识0和1两个数字，我们在屏幕上看到的文字，在存储到内存之前也都被转换成了二进制。下面是小编分享的ASCII编码和Unicode编码，欢迎大家参考!

　　可想而知，特定的文字必然对应着固定的二进制，否则将无法转换。那么，怎样将文字与二进制对应呢?这就需要有一套规范，计算机公司和软件开发者都必须遵守。

　　ASCII码

　　我们知道，一个二进制位(Bit)有0、1两种状态，一个字节(Byte)有8个二进制位，有256种状态，每种状态对应一个符号，就是256个符号，从00000000到11111111。

　　计算机诞生于美国，早期的计算机使用者大多使用英文，上世纪60年代，美国制定了一套英文字符与二进制位的对应关系，称为ASCII码，沿用至今。

　　ASCII码规定了128个英文字符与二进制的对应关系，占用一个字节(实际上只占用了一个字节的后面7位，最前面1位统一规定为0)。例如，字母 a 的的ASCII码为 01100001，那么你暂时可以理解为字母 a 存储到内存之前会被转换为 01100001，读取时遇到 01100001 也会转换为 a。

　　Unicode编码

　　随着计算机的流行，使用计算机的人越来越多，不仅限于美国，整个世界都在使用，这个时候ASCII编码的问题就凸现出来了。

　　ASCII编码只占用1个字节，最多只能表示256个字符，我大中华区10万汉字怎么表示，日语韩语拉丁语怎么表示?所以90年代又制定了一套新的规范，将全世界范围内的字符统一使用一种方式在计算机中表示，这就是Unicode编码(Unique Code)，也称统一码、万国码。

　　Unicode 是一个很大的集合，现在的规模可以容纳100多万个符号，每个符号的对应的二进制都不一样。Unicode 规定可以使用多个字节表示一个字符，例如 a 的编码为 01100001，一个字节就够了，”好“的编码为 01011001 01111101，需要两个字节。

　　为了兼容ASCII，Unicode 规定前0~127个字符与ASCII是一样的，不一样的只是128~255的这一段。

1.《unicode字符 ASCII编码和Unicode编码》援引自互联网，旨在传递更多网络信息知识，仅代表作者本人观点，与本网站无关，侵删请联系页脚下方联系方式。

2.《unicode字符 ASCII编码和Unicode编码》仅供读者参考，本网站未对该内容进行证实，对其原创性、真实性、完整性、及时性不作任何保证。

3.文章转载时请保留本站内容来源地址，https://www.lu-xu.com/jiaoyu/76795.html

unicode字符 ASCII编码和Unicode编码

c语言代码大全 C语言基础知识大全

c语言入门书籍 C语言入门必备书籍推荐