繁体中文的中文编码

繁体中文的中文编码,第1张

繁体中文自1980年代以来通常使用Big5中文编码。而中国大陆使用GB2312的国标简体中文编码。台湾曾公布过一套名为CNS 11643的编码,但并未被广泛采用。近年来随着Unicode跨语言编码集的出现,也得到了广泛使用。香港政府所使用的即为采用Unicode的UTF-8编码,同时因香港本身存在的一些口语词,政府也用UTF-8发行香港增补字符集。

而现在,中国大陆又推行了一套GBK国标编码,这套编码在以前的GB2312国标简体中文编码的基础上,增加了繁体中文、日文和韩文的编码,目前已在台湾等部分地区推行使用。我们现在计算机上用的就是GBK国标编码,之所以有很多人能在简体中文版的Windows操作系统中写出繁体字,甚至是日文等,正是因为GBK国标编码兼容繁体中文和日文的原因。

1GB2321: 简体中文编码,一个汉字占用2个字节,在大陆是主要编码方式。当文章/网页中包含繁体中文、日文、韩文等等时,这些内容可能无法被正确编码。

2BIG5: 繁体中文编码,主要在台湾地区采用。

3GBK: 支持简体及繁体中文,但对他国非拉丁字母语言还是有问题。

4UTF-8: Unicode编码的一种。Unicode用一些基本的保留字符制定了三套编码方式,它们分别UTF-8,UTF-16和UTF-32。在UTF-8中,字符是以8位序列来编码的,用一个或几个字节来表示一个字符。这种方式的最大好处,是UTF-8保留了ASCII字符的编码做为它的一部分。UTF-8俗称“万国码”,可以同屏显示多语种,一个汉字占用3字节。为了做到国际化,网页应尽可能采用UTF-8编码。

当然,处理中文时>

简体中文自1980年代以来通常使用中华人民共和国国家标准总局公布的GB 2312,以及其后继的GBK和GB 18030中文编码。近年来随着Unicode跨语言编码集的出现,也被广泛使用。

GBK: 汉字国标扩展码,基本上采用了原来GB2312-80所有的汉字及码位,并涵盖了原Unicode中所有的汉字20902,总共收录了883个符号, 21003个汉字及提供了1894个造字码位。 Microsoft简体版中文Windows 95就是以GBK为内码,又由于GBK同时也涵盖了Unicode所有CJK汉字,所以也可以和Unicode做一一对应。

GB码,全称是GB2312-80《信息交换用汉字编码字符集 基本集》,1980年发布,是中文信息处理的国家标准,在大陆及海外使用简体中文的地区(如新加坡等)是强制使用的唯一中文编码。P-Windows32和苹果OS就是以GB2312为基本汉字编码, Windows 95/98则以GBK为基本汉字编码、但兼容支持GB2312。GB码共收录6763个简体汉字、682个符号,其中汉字部分:一级字3755,以拼音排序,二级字3008,以偏旁排序。该标准的制定和应用为规范、推动中文信息化进程起了很大作用。

GBK编码是中国大陆制订的、等同于UCS的新的中文编码扩展国家标准。GBK工作小组于1995年10月,同年12月完成GBK规范。该编码标准兼容GB2312,共收录汉字21003个、符号883个,并提供1894个造字码位,简、繁体字融于一库。

以上就是关于繁体中文的中文编码全部的内容,包括:繁体中文的中文编码、常见字符编码格式、简体中文的中文编码等相关内容解答,如果想了解更多相关内容,可以关注我们,你们的支持是我们更新的动力!

欢迎分享,转载请注明来源:聚客百科

原文地址: http://juke.outofmemory.cn/life/3739467.html

()
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2023-04-30
下一篇 2023-04-30

发表评论

登录后才能评论

评论列表(0条)

保存