UnicodeDecodeError: 'gbk' codec can't decode byte 0x91 in position 54: illegal multibyte sequence

### 解决方案当遇到 `UnicodeDecodeError` 错误提示 `'gbk' codec can't decode byte 0x9a in position 27: illegal multibyte sequence` 的情况时，这通常意味着尝试使用的编码方式与实际文件的编码不匹配。可以采取多种方法来解决问题。 #### 方法一：指定正确的编码格式如果知道文件的实际编码，则可以在打开文件时显式指明该编码。对于大多数中文环境下的文本文件来说，默认可能是 UTF-8 编码而非 GBK 编码。因此，在读取文件前先尝试使用 UTF-8 进行解码： ```python with open('example.txt', 'r', encoding='utf-8') as f: content = f.read() ``` 这种方法适用于那些实际上是以 UTF-8 编码保存但却被错误地当作 GBK 来处理的情况[^1]。 #### 方法二：忽略或替换非法字符有时即使知道了正确的编码也无法完全避免此问题的发生，因为某些特殊情况下可能会存在一些不符合标准的数据。此时可以选择跳过这些有问题的部分或者将其替换成其他符号： ```python # 忽略错误并继续执行 with open('example.txt', 'r', errors='ignore', encoding='gbk') as f: content = f.read() # 使用问号代替无法识别的字符 with open('example.txt', 'r', errors='replace', encoding='gbk') as f: content = f.read().replace('\ufffd', '?') ``` 上述代码片段展示了两种不同的策略来应对潜在的编码头疼——要么简单地丢弃它们(`errors='ignore'`)；要么用占位符替代(`errors='replace'`)[^2]。 #### 方法三：检测未知编码如果不确定源文件的具体编码形式，那么可以通过第三方库如 chardet 自动探测最可能的编码类型: 安装chardet模块： ```bash pip install chardet ``` 编写如下脚本以自动判断文件编码并据此调整读取参数： ```python import chardet rawdata = open('example.txt', 'rb').read() result = chardet.detect(rawdata) encoding = result['encoding'] print(f"The detected file encoding is {encoding}") with open('example.txt', 'r', encoding=encoding, errors='ignore') as f: content = f.read() ``` 通过这种方式能够更灵活地适应不同类型的输入数据集而无需手动猜测其内部表示法。

阅读全文

UnicodeDecodeError: 'gbk' codec can't decode byte 0x91 in position 54: illegal multibyte sequence

相关推荐

basemap readshapefile UnicodeDecodeError: 'utf-8' codec can't decode byte 0xb4 in position 0-附件资源

UnicodeDecodeError: 'utf-8' codec can't decode byte 0xd5 in position 2: invalid continuation byte-附件资源

UnicodeDecodeError: gbk codec can't decode byte 0x80 in position 7: illegal multibyte sequence

UnicodeDecodeError: gbk codec can t decode byte 0x80 in position 234: illegal multibyte sequence yolov5 5.0

UnicodeDecodeError: gbk codec can t decode byte 0xaa in position 25: illegal multibyte sequence

python UnicodeDecodeError: gbk codec can t decode byte 0xaa in position 308: illegal multibyte sequence

UnicodeDecodeError: gbk codec can t decode byte 0xae in position 251: illegal multibyte sequence

UnicodeDecodeError: gbk codec can t decode byte 0xa2 in position 155: illegal multibyte sequence

pycharm报错UnicodeDecodeError: gbk codec can t decode byte 0xae in position 34: illegal multibyte sequence

UnicodeDecodeError: gbk codec can not decode byte 0xa3 in position 277：illegal multibyte sequence

UnicodeDecodeError: 'gbk' codec can't decode byte 0x91 in position 24: illegal multibyte sequence

UnicodeDecodeError: 'gbk' codec can't decode byte 0x91 in position 8: illegal multibyte sequence

UnicodeDecodeError: 'gbk' codec can't decode byte 0x91 in position 26: illegal multibyte sequence

UnicodeDecodeError: 'gbk' codec can't decode byte 0x91 in position 10: illegal multibyte sequence

UnicodeDecodeError: 'gbk' codec can't decode byte 0x91 in position 2: illegal multibyte sequence

UnicodeDecodeError: 'gbk' codec can't decode byte 0x91 in position 283: illegal multibyte sequence

UnicodeDecodeError: 'gbk' codec can't decode byte 0x91 in position 103: illegal multibyte sequence

UnicodeDecodeError: 'gbk' codec can't decode byte 0x91 in position 363: illegal multibyte sequence

UnicodeDecodeError: 'gbk' codec can't decode byte 0x8c in position 54: illegal multibyte sequence

UnicodeDecodeError: 'gbk' codec can't decode byte 0x80 in position 91: illegal multibyte sequence

大家在看

umeshmotion子程序汇总

2017年全国文保单位空间分布数据.zip

Actor-Critic原理和PPO算法推导，PPT讲解

建行总行信息技术类09、10、11三年的笔试回忆资料

johnson-cook.zip_drawbbc_johnson cook_johnson cook umat_johnson-

最新推荐

说出你们的故事—网络沟通-新娘篇.docx

深入解析PetShop4.0电子商务架构与技术细节

【技术揭秘】：7步打造YOLOv8人员溺水检测告警监控系统

stm32CAN总线

毕业设计资料分享与学习方法探讨

模式识别期末复习精讲：87个问题的全面解析与策略

import torch import numpy as np def a2t(): np_data = np.array([[1, 2],[3,4]]) #/********** Begin *********/ #将np_data转为对应的tensor，赋给变量torch_data torch_data = torch.tensor(np_data) #/********** End *********/ return(torch_data)

电脑垃圾清理专家：提升系统运行效率

模式识别期末复习必备：掌握87个知识点的速成秘籍

redis集群模式配置

import torch import numpy as np def a2t(): np_data = np.array([[1, 2],[3,4]]) #/****** Begin */ #将np_data转为对应的tensor，赋给变量torch_data torch_data = torch.tensor(np_data) #/ End ***/ return(torch_data)