base64 编码

Base64是一种使用64个可打印字符对数据进行编码的方法,常用于在网络上传输二进制数据。编码过程涉及将3个字节拆分为4个6位的块,不足部分用0填充,然后转换成编码字符。编码后数据长度会增加约1/3,编码后的结尾可能用'='表示填充。编码字符不包含0,因为0不代表有效数据。很多编程语言如C#、Java、Python内置了Base64的编解码函数。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

注意:base64 只是一种编码,并不适合用来加密数据。

一、组成

base64 编码就是用 64 个可打印的字符作为一个字符集来表示数据。这 64 个字符包括A-Za-z0-9这62个常见字符,另外还有两个可打印字符在不同的系统中可能会有所不同,常见的是+/这两个字符。

二、base64 的编码过程

将每 3 个字节放入一个 24 位的缓冲区中,最后不足 3 个字节的,缓冲区的剩余部分用 0 来填补。然后每次取出 6 位(2 的 6 次方为 64,使用 64 个字符即可表示所有),将高 2 位用 0 来填充,组成一个新的字节,计算出这个新字节的十进制值,对应上面的编码表,输出相应的字符。这样不断地进行下去,就可完成对所有数据的编码工作。

按照以上规则对文本 Man 编码如下:

这样就把文本 Man 编码为了 TWFu。

按照这种编码规则,原来的 24 位(3 个字节)最后变成了 4 个新的字节(32 位),所以编码后的数据比原数据略长 1/3。

注意最后不足 3 个字节的部分用 0 来填补了,那么最后计算出来的十进制值是 0,但是不能对应编码表中的 A(尽管 A 对应 0),因为用来填补的 0 不是有效数据,所以 base64 编码使用 = 来代替 A 表示无效的 0。

因为 = 并不表示有效数据,所以用于对有效数据编码的是 64 个字符,而不是 65 个,所以是 base64,而非 base65!

因为 base64 的应用如此广泛,所以好多编程语言都自带了 base64 的编解码函数,比如 C#、Java、python等自身都有对应 base64 的编解码函数。

三、为什么要使用 64 个字符

如果每次取更多的位(多于 6 位)来计算,那么字符集的范围将大大增加,编码的应用范围将受到限制。如果每次取更少的位(少于 6 位)来计算,那么编码之后的数据长度就会增加,同样的数据编码之后就需要传输更多的字符。所以,每次取 6 位(2 的 6 次方为 64,使用 64 个字符即可表示所有)来计算刚好平衡了以上这两点。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

JFS_Study

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值