# -*- coding: utf-8 -*
时间: 2025-02-12 11:13:29 浏览: 51
### 如何在Python文件中设置UTF-8编码声明
为了确保Python解释器能够正确识别源代码中的字符编码,在Python文件的第一行或第二行添加编码声明是非常重要的。对于UTF-8编码,可以在文件顶部加入如下声明:
```python
# -*- coding: utf-8 -*-
```
或者采用更简洁的形式:
```python
#!/usr/bin/env python3
# encoding=utf-8
```
这两种方法都可以有效地告诉解释器该文件使用的是UTF-8编码[^3]。
当处理JSONL文件或其他文本数据时,如果遇到编码不一致的问题,可以考虑通过指定`open()`函数的`encoding`参数来强制读取特定编码的数据。例如,要将所有输入文件转换为标准的UTF-8编码并保存下来,可参照以下脚本框架[^1]:
```python
import os
import json
def process_file(input_path, output_path):
with open(input_path, 'r', encoding='utf-8') as infile:
lines = infile.readlines()
with open(output_path, 'w', encoding='utf-8') as outfile:
for line in lines:
try:
obj = json.loads(line.strip())
outfile.write(json.dumps(obj, ensure_ascii=False).encode('utf-8').decode() + '\n')
except Exception as e:
print(f"Error processing {input_path}: {e}")
if __name__ == "__main__":
input_dir = "path/to/input/files"
output_dir = "path/to/output/files"
if not os.path.exists(output_dir):
os.makedirs(output_dir)
for filename in os.listdir(input_dir):
if filename.endswith(".jsonl"):
process_file(os.path.join(input_dir, filename), os.path.join(output_dir, filename))
```
此段代码展示了如何遍历目录下的`.jsonl`文件,并逐个将其内容重新编码为UTF-8格式再写出到新的位置。注意这里还包含了异常捕获机制用于应对可能存在的解析错误情况。
阅读全文
相关推荐



















