Go语言中如何处理多字节的字符串(rune方法)

Go语言的字符串处理涉及byte和rune类型。byte是uint8的别名,适合处理单字节字符如英文和数字,但在处理多字节字符如中文时可能出现乱码。相反,rune是int32的别名,设计用来正确处理包括多字节字符的Unicode码点,确保字符正确显示。示例代码展示了byte类型在赋值多字节字符时的错误,而rune类型能正确处理。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

Go语言字符串中的字符有英文字符、数字、中文字符等等,Go语言处理纯英文数字字符串可以使用byte类型

1.byte类型

        byte类型 是 uint8的别名,表示一个字节
2.rune类型

        rune类型是Go语言中的一个基本类型,其实是一个int32的别名,主要用于表示一个字符类型大于一个字节小于等于4个字节的情况下,特别是中文字符,rune类型的值与Unicode码点一一对应。

下面的代码可以看出这两个类型的区别:

import "fmt"

func main(){
	var str string="123中国"
	fmt.Println("byte=",[]byte(str))
	fmt.Println("byte=",[]rune(str))
	fmt.Println(str[:4])
    fmt.Println(string([]byte(str)[:4]))
	fmt.Println(string([]rune(str)[:4]))
}

执行结果:

 

byte类型在处理多字节字符时,会出现乱码, 而rune类型可以正常处理。

	var str string = "123中国"
	bytes := []byte(str)
	bytes[0] = '中' // 程序爆红 不能编译
	str = string(bytes)
	fmt.Printf("%s\n", str)

由上面的代码可以看到,字符串byte类型转化后,赋于多字节字符会报错。

	var str string = "123看中国"
	runes := []rune(str)
	runes[3] = '大'
	str = string(runes)
	fmt.Printf("%s\n", str) // 123大中国

程序运行正常

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值