当前位置：首页 > 房产信息

取的拼音实战经验：获取中文的拼音表示

2021-03-25 06:36:26 房产信息取的拼音,汉字,字符集,字节,字符

问题

遇到这样的需求，给一个汉字，比如“中”，得到它的拼音表示，比如:中。

思路

在Unicode开发环境中，每个字符，无论是汉字还是ASCII字符，都由两个字节表示。例如:

TCHAR CP = _ T(' A ')；

这里，cp的大小是两个字节，cp的值是0x0041。

Tchach2 = _ t('中')；

这里ch2的大小也是两个字节，cp的值是0x4E2D。

要得到汉字的拼音，首先要得到对应的GB2312/GBK汉字内码。需要注意的是，Unicode字符集和GB2312/GBK字符集是两种不兼容的字符编码标准。比如“中”的Unicode码是0x4E2D，而它的GB2312/GBK码是0xD6D0。

得到汉字对应的GB2312/GBK内码后，查询GB2312/GBK标准就可以得到其对应的拼音。

实现方法

1)通过WideCharToMultiByte将Unicode字符集转换为ANSI字符集。

2)要判断转换后的ANSI字符是否为ASCII字符，可以使用isascii函数进行判断。

3)如果转换后的ANSI字符的上下字节大于0xA0，则表示是汉字，其GB2312/GBK内码可以通过以下公式得到。

ChHigh =高8字节(汉字)；

ChLow =下八位字节(汉字)；

GBK =(ChHigh–0xa 0)* 100+ChLow–0xa 0；

4)根据GB2312/GBK表查询对应的拼音表示。

总结

对于没有对应关系的两个字符集Unicode和GB2312/GBK，只有查表才能找到对应关系。

1.《取的拼音实战经验：获取中文的拼音表示》援引自互联网，旨在传递更多网络信息知识，仅代表作者本人观点，与本网站无关，侵删请联系页脚下方联系方式。

2.《取的拼音实战经验：获取中文的拼音表示》仅供读者参考，本网站未对该内容进行证实，对其原创性、真实性、完整性、及时性不作任何保证。

3.文章转载时请保留本站内容来源地址，https://www.lu-xu.com/fangchan/1070138.html

岁月如梭的意思汉字解读【每日一字】岁：时间如流岁月如梭

日出而作，日落而息ヾ如此空虚ヾ如此空虚﹏ ℡私人思想℡私人欲望╮ ◆ ﹏深刻﹏﹏难忘﹏﹏我想念你的善良。而不是软弱，/。 m '烟花容易凉，m '人生分。心疼~心痛~ つ自然属于stay-╯つNatural sprout-╯ ゝ雇用_爱ゝ标志_爱 {谈爱''说爱} 〢↘不弃。┆〢↘...

　　近年来,“国风文化”逐渐流行,广受当代年轻人追捧,成为了一种流行现象。国风音乐、国风服饰、国风类综艺节目不断涌现,有态度、有个性,融合时尚与中国本土元素的国风文...

五个小时内，百度和字节跳动相继宣布将对对方提起诉讼。百度将在这场对抗中领先。4月26日上午11时，百度宣布今日头条盗取了大量百度“TOP1”搜索产品，将以不正当竞争为由向北京市海淀区人民法院起诉，要求字节跳动立即停止侵权行为，赔偿相关经济损失9000万元，并在其APP和网站首页连续30天道...

出发地:霍利斯(微信号:霍利舒昂)在文章《阿里巴巴为什么不建议在for循环中使用“+”进行字符串拼接》中，我们介绍了Java中字符串拼接的几种方法，以及它们的优缺点。还有一个我没有介绍的重要的拼接方法，就是Java 8中提供的StringJoiner。本文将介绍这种字符串拼接的新成员。如果...