常见编码分析
二进制(bit)
0或1
字节(byte)
一个字节占8个bit位,一个字节可以表示0到255之间的整数值。如果要表示256这个数值,需要使用至少两个字节。
例如,十进制数值10的字节表示为00001010。
字节是计算机信息存储的基本单位,通常由8个二进制位(bit)组成。
1 KB(kilobyte,千字节)等于1024字节;
1 MB(megabyte,兆字节)等于1024 KB;
1 GB(gigabyte,吉字节)等于1024 MB;
1 TB(terabyte,太字节)等于1024 GB;
1 PB(petabyte,拍字节)等于1024 TB;
1 EB(exabyte,艾字节)等于1024 PB;
1 ZB(zettabyte,泽字节)等于1024 EB;
1 YB(yottabyte,佑字节)等于1024 ZB。
ASCII码
每个字符用一个字节表示,范围是0到127。例如,字符 'A' 的ASCII码是65,用二进制表示就是01000001。
UTF-8编码
采用1至4个字节不等的编码长度。
英文大小写字母和数字,特殊符号都采用一个字节表示, 中文用三个字节表示,
ISO-8859-1
每个字符用一个字节表示,范围是0到255,覆盖了拉丁字母及西欧其他语言的字符。
GB2312、GBK、Big5
这些中文编码方式通常采用两个字节表示一个中文字符,范围不同,可以覆盖简体中文和繁体中文的字符。
Hex编码(Hexadecimal Encoding) 十六进制
十六进制使用0-9以及a-f 表示数字0到15
一个字节(8位)的二进制数 可以用两个十六进制数字表示
例如,二进制数11011011可以转换为十六进制数: