通常我们所说是2字节(GB-2312)。
具体依据汉字编码形式有所不同:
GB-231280
编码为
2个字节(Byte)
包含了
20902
个汉字,其编码范围是
0x8140-0xfefe。
GB18030-2000(GBK2K)
在
GBK
的基础上进一步扩展了汉字,增加了藏、蒙等少数民族的字形。编码是变长的,其二字节部分与
GBK
兼容;四字节部分是扩充的字形、字位,其编码范围是首字节
0x81-0xfe、二字节0x30-0x39、三字节
0x81-0xfe、四字节0x30-0x39
Unicode
范围一般所用为\U0000-\UFFFF,对于CJK
EXT
B区汉字,范围大于\U20000
UTF,
按其基本长度所用位数分为UTF-8/16/32。其中:
UTF-8是变长编码,每个Unicode代码点按照不同范围,可以有1-3字节的不同长度。
UTF-16长度相对固定,只要不处理大于\U200000范围的字符,每个Unicode代码点使用16位即2字节表示,超出部分使用两个UTF-16即4字节表示。按照高低位字节顺序,又分为UTF-16BE/UTF-16LE。
UTF-32长度始终固定,每个Unicode代码点使用32位即4字节表示。按照高低位字节顺序,又分为UTF-32BE/UTF-32LE。
无法确定,因为字的大小取决去具体系统的总线宽度,如果是32位的系统,则一个字是4个字节,如果是64位,则是8个字节。
字节(Byte)是计算机信息技术用于计量存储容量的一种计量单位,也表示一些计算机编程语言中的数据类型和语言字符。一个字节存储8位无符号数,储存的数值范围为0-255。如同字元一样,字节型态的变数只需要用一个位元组(8位元)的内存空间储存。
数据类型
字节(Byte)是计算机信息技术用于计量存储容量的一种计量单位,也表示一些计算机编程语言中的数据类型和语言字符。Byte是从0-255的无符号类型,所以不能表示负数。