目录
什么是字符与字符集?
-
字符:字符是信息的基本单元,可以是字母、数字、特殊符号、空格等。例如
'A'
,'1'
, 或'$'
都是字符。 -
字符集:字符集是用来定义哪些字符可以被表示的一种规则集合,同时赋予了每个字符一个对应编码值。例如:
- ASCII 是早期的字符集,支持大约 128 个字符。
- Unicode 是现代的字符集,支持全球绝大多数语言的字符。
-
字符编码:
- 字符编码将字符和二进制数据(机器可处理的形式)之间进行转换。
- 常见的编码格式有:
ASCII
,UTF-8
,UTF-16
,UTF-32
等。
Python 字符的基本操作
在 Python 中,字符实际上是长度为 1 的字符串。
1. 字符与 Unicode 字符码交互
Python 提供了 ord()
和 chr()
两个内置方法用来在字符和其 Unicode 码之间进行转换。
Python
# 获取字符的 Unicode 值
char = 'A'
unicode_code = ord(char)
print(f"字符 {char} 的 Unicode 码值为:{unicode_code}") # 输出 65
# 反向获取字符
code = 97
char = chr(code)
print(f"Unicode 码值 {code} 对应的字符为:{char}") # 输出 'a'
2. 常用内置字符串操作方法
Python 提供了丰富的字符串处理方法,用来处理字符级别的问题:
Python
text = "Hello, Python!"
# 判断是否是字母、数字或空白
print(text[0].isalpha()) # True -> 'H' 是字母
print(text[6].isdigit()) # False -> ',' 不是数字
print(" ".isspace()) # True -> 空格是空白字符
# 转换大小写
print(text.lower()) # "hello, python!" -> 转为小写
print(text.upper()) # "HELLO, PYTHON!" -> 转为大写
# 检查字符的 ASCII 值范围
print("A".is