base64 编码

最新推荐文章于 2025-04-17 08:51:36 发布

JFS_Study

最新推荐文章于 2025-04-17 08:51:36 发布

阅读量1.7k

点赞数

分类专栏： encryption 文章标签： java

本文链接：https://blog.csdn.net/ChineseSoftware/article/details/123045855

版权

encryption 专栏收录该内容

3 篇文章

订阅专栏

Base64是一种使用64个可打印字符对数据进行编码的方法，常用于在网络上传输二进制数据。编码过程涉及将3个字节拆分为4个6位的块，不足部分用0填充，然后转换成编码字符。编码后数据长度会增加约1/3，编码后的结尾可能用'='表示填充。编码字符不包含0，因为0不代表有效数据。很多编程语言如C#、Java、Python内置了Base64的编解码函数。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

`注意：base64 只是一种编码，并不适合用来加密数据。`

一、组成

base64 编码就是用 64 个可打印的字符作为一个字符集来表示数据。这 64 个字符包括A-Z、a-z、0-9这62个常见字符，另外还有两个可打印字符在不同的系统中可能会有所不同，常见的是+和/这两个字符。

二、base64 的编码过程

将每 3 个字节放入一个 24 位的缓冲区中，最后不足 3 个字节的，缓冲区的剩余部分用 0 来填补。然后每次取出 6 位(2 的 6 次方为 64，使用 64 个字符即可表示所有)，将高 2 位用 0 来填充，组成一个新的字节，计算出这个新字节的十进制值，对应上面的编码表，输出相应的字符。这样不断地进行下去，就可完成对所有数据的编码工作。

按照以上规则对文本 Man 编码如下：

这样就把文本 Man 编码为了 TWFu。

按照这种编码规则，原来的 24 位(3 个字节)最后变成了 4 个新的字节(32 位)，所以编码后的数据比原数据略长 1/3。

注意最后不足 3 个字节的部分用 0 来填补了，那么最后计算出来的十进制值是 0，但是不能对应编码表中的 A(尽管 A 对应 0)，因为用来填补的 0 不是有效数据，所以 base64 编码使用 = 来代替 A 表示无效的 0。

因为 = 并不表示有效数据，所以用于对有效数据编码的是 64 个字符，而不是 65 个，所以是 base64，而非 base65！

因为 base64 的应用如此广泛，所以好多编程语言都自带了 base64 的编解码函数，比如 C#、Java、python等自身都有对应 base64 的编解码函数。

三、为什么要使用 64 个字符

如果每次取更多的位(多于 6 位)来计算，那么字符集的范围将大大增加，编码的应用范围将受到限制。如果每次取更少的位(少于 6 位)来计算，那么编码之后的数据长度就会增加，同样的数据编码之后就需要传输更多的字符。所以，每次取 6 位(2 的 6 次方为 64，使用 64 个字符即可表示所有)来计算刚好平衡了以上这两点。