UnicodeDecodeError: 'utf8' codec can't decode byte

rwen001

于 2013-08-24 23:41:26 发布

阅读量1.1k

点赞数

CC 4.0 BY-SA版权

分类专栏： Python

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/wang1144/article/details/10287379

Python 专栏收录该内容

60 篇文章

订阅专栏

本文探讨了在处理UTF-8编码文本时遇到的乱码问题。作者在尝试对字符串进行截取操作以便只显示部分中文内容时遇到了乱码问题。通过对问题的深入研究发现，截取操作不当导致中文字符被分割，从而引发乱码。最终找到了正确的解决方案。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

最近老是出现如题这样的错误，本来解析的就是utf-8编码的字符，但是页面显示时就报这个错误，在网上找了半天，结果都说是字符集选得不对，不论对字符做encode,还是decode都出错，最后终于找到问题，原来是我对字符做了一个截取的操作，因为页面显示一段文本时只显示１００个中文字，我就用了s[:100],这就是问题的根源所在，因为串里面有中文有英文，所以当这样截取的时候可能会把一个中文字符截出一半，所以就会出现乱码！别的一些问题可以在网上容易找到，但是我这个低级的错误还没有遇见过

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。