pandas 截取字符串前两位
时间: 2025-02-02 18:51:27 浏览: 40
### 使用 Pandas 截取 DataFrame 列中字符串的前两位
为了截取 Pandas DataFrame 中某一列字符串类型的前两位字符,可以利用 `pandas.Series.str` 访问器提供的方法来进行操作。具体来说,可以通过切片的方式获取所需的子串部分。
下面是一个具体的例子展示如何完成这一任务:
假设有一个名为 `data` 的 DataFrame,并且其中有一列表示时间戳记为 `'time'` ,目标是从该列中提取每个月份对应的数值(即字符串的第5位到第6位),并将其转换为整型表示月份[^2]。
```python
import pandas as pd
# 创建样例数据集
data = pd.DataFrame({'time': ['19010100', '19020100', '19030100']})
# 提取出'time'列中的第4和第5个位置上的两个数字作为月份, 同时将结果转化为整数形式
month = (data['time'].astype(str).str[4:6]).astype(int)
print(month)
```
上述代码片段展示了怎样通过指定索引来选取特定范围内的字符序列;这里采用的是 Python 字符串切片语法 `[start:end]` 来定位起始与结束的位置。值得注意的是,在此过程中先将原数据强制类型转换成了字符串格式以便于处理,最后再变回整数以去除任何可能存在的前置零。
对于想要取得每行记录里最前面那两个字符的情况,则只需要调整切片参数即可,如下所示:
```python
first_two_chars = data['time'].astype(str).str[:2]
print(first_two_chars)
```
这段脚本将会读取每一项条目中最左边的两个字符而不做额外的数据类型变换。
阅读全文
相关推荐

















