pandas字符串处理及列转行

Darin2017

已于 2025-06-12 09:29:13 修改

阅读量1k

点赞数 8

CC 4.0 BY-SA版权

文章标签： pandas

于 2023-12-19 18:13:40 首次发布

本文链接：https://blog.csdn.net/Darin2017/article/details/135085295

文章介绍了如何在Python的Pandas库中使用str函数对DataFrame进行各种字符串操作，如截取、分割、合并、替换、判断和格式化，以提取和处理数据中的信息。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

df1.loc[:,'前部']=df1['班级名称'].str.slice(0,15)
df1.loc[:,'大区']=df1['班级名称'].str.split('-').str[0]
df1.loc[:,'版本']=df1['班级名称'].str.split('-').str[1]
df1.loc[:,'进度']=df1['班级名称'].str.split('-').str[2]
df1.loc[:,'时间']=df1['班级名称'].str.split('-').str[3]
df1.loc[:,'时间1']=df1['时间'].str.split('(').str[0]
df1['id尾号']=df1['姓名id'].str.split('-',n=2).str[1].str.slice(0,6)

常规字符串截取处理

（编辑技巧：mac❀+数字2，设定为目录）

1、str.cat和指定字符串

df1.loc[:,'合并']=df1['大区'].str.cat(df1['版本'],sep='-').str.cat(df1['进度'],sep='-')

str.cat可以连接多列，并设定连接符

2、split按照指定字符分割

df1.loc[:,'大区']=df1['班级名称'].str.split('-').str[0]

df1['id尾号']=df1['姓名id'].str.split('-',n=2).str[1].str.slice(0,6)

以上为按‘-’分割某列，并取分割后的第一部分字符串

split('-',expand=True,n=1)，expand默认是False，若设置为True则会将列表展开，变成多列，n是设置分列的次数，n=1则分割一次，成2部分

rsplit和split用法一致，只不过是从右边开始分列

3、partition按照指定字符进行分割，且只分割一次

df1.loc[:,'1']=df

最低0.47元/天解锁文章

200万优质内容无限畅学

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

Darin2017

关注关注

8
点赞
踩
12

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

python pandas数据处理excel、csv列转行、行转列（具体示例）

c1007857613的专栏

04-14

4949

python pandas数据处理excel、csv列转行、行转列（具体示例）

Python Pandas处理字符串（方法详解）

ccc369639963的博客

04-18

1164

Python Pandas处理字符串（方法详解） Pandas 提供了一系列的字符串函数，因此能够很方便地对字符串进行处理。在本节，我们使用 Series 对象对常用的字符串函数进行讲解。常用的字符串处理函数如下表所示：函数名称函数功能和描述 lower() 将的字符串转换为小写。 upper() 将的字符串转换为大写。 len() 得出字符串的长度。 strip() 去除字符串两边的空格（包含换行符）。 split() 用指定的分割符分割字符串。 cat(sep=

参与评论您还未登录，请先登录后发表或查看评论

【转载】pandas如何进行优雅的列转行、行转列？

qq_28679113的博客

08-11

358

pandas如何进行优雅的列转行、行转列

pandas 字符串处理方法介绍

zhusongziye的博客

11-23

4848

本文示例代码及文件已上传至Github仓库：https://github.com/CNFeffery/DataScienceStudyNotes 1 简介在日常开展数据分析的过程中，我们经常需要对字符串类型数据进行处理，此类过程往往都比较繁琐，而pandas作为表格数据分析利器，其内置的基于Series.str访问器的诸多针对字符串进行处理的方法，以及一些top-level级的内置函数，则可以帮助我们大大提升字符串型数据处理的效率。本文我就将带大家学习pandas中常用的一些高效字符串处理方法..

10.Pandas字符串处理

CSDN专家-微编程的博客

08-14

312

1.先获取Series的str属性，然后在属性上调用函数2.只能在字符串列上使用，不能数字列上使用3.DataFrame上没有str属性和处理方法4.Series.str并不是Python原生字符串，而是自己的一套方法，不多大部分和原生str很相似。...

【Python】Pandas处理字符串方法汇总

fengdu78的博客

12-22

4332

公众号：尤而小屋作者：Peter编辑：Peter本文给大家介绍的是如何使用Pandas来操作字符串数据。字符串是一种常见的数据类型，我们遇到的文本、json数据等都是属于字符串的范畴。Python内置了很多处理字符串的方法，这些方法为我们处理和清洗数据提供了很大的便利。python内置方法#1、自定义字符串 x="hellopython!" x'hello python!'查看x的类型：...

Pandas 十：字符串处理

cai_and_luo的博客

05-20

802

Pandas 十：字符串处理0、读取北京2018年天气数据1、获取Series的str属性，使用各种字符串处理函数2、使用str的startswith、contains等得到bool的Series可以做条件查询3、需要多次str处理的链式操作4. 使用正则表达式的处理前面我们已经使用了字符串的处理函数： df[“bWendu”].str.replace(“℃”, “”).astype(‘int32’) Pandas的字符串处理：使用方法：先获取Series的str属性，然后在属性上调用函数；只能在字符

Python pandas 列转行操作详解(类似hive中explode方法)

09-16

本文将详细讲解如何在pandas中进行列转行的操作，类似于Hive中的explode方法，这对于处理包含列表或者数组的数据尤为有用。首先，我们来看一个简单的例子。假设有一个DataFrame `df`，其中包含两列：`A` 和 `B`，`...

【数据处理】pandas DataFrame 实现某列中分隔数据转成多行 split explode

热门推荐

scxyz的博客

04-23

1万+

DataFrame中某列由“逗号”分隔，格式如下。希望转换后，分隔的行全部以列的形式重新排列。处理前：处理后：转换代码如下。 import pandas as pd df = pd.DataFrame([{'var1': 'a,b,c', 'var2': 1}, {'var1': 'd,e', 'var2': 2}]) df1 = pd.concat...

Pandas实现DataFrame按行求百分数(比例数)

09-18

DataFrame是由列（columns）和行（index）组成的一个二维表格型数据结构，可以存储各种类型的数据，包括整数、浮点数、字符串等。每个单元格内的数据可以视为一个样本，而每一行则代表一个观测值或实体。在本例中...

pandas 行转列、列转行.ipynb

04-06

长数据宽数据转换，pandas 一列拆分多列，pandas pivot——table使用，pandas.melt 使用

pandas——字符串处理【建议收藏】

阿极的博客

02-13

2234

cat() 拼接字符串、split()切片字符串、get() 获取指定位置的字符串、contains() 是否包含表达式，返回True或False、replace() 字符串替换、slice() 按字符串下标的开始结束位置切割字符串、count() 计算给定单词出现的次数、len() 计算字符串的长度、strip()去除前后的空白字符、lower() 全部小写、upper() 全部大写、index() 查找给定字符串的位

2-5_Pandas_String_Operations pandas字符串操作

youif的博客

02-12

505

pandas字符串操作很明显除了数值型，我们处理的数据还有很多字符类型的，而这部分数据显然也非常重要，因此这个部分我们提一提pandas的字符串处理。 # * coding:utf-8_*_ # 作者 :XiangLin # 创建时间 :11/02/2020 20:15 # 文件 :2-5_Pandas_String_Operations.py # IDE :PyCha...

Pandas处理字符串——《Python数据分析库Pandas》

Python老吕的博客

05-24

1261

Pandas为处理字符串数据提供了丰富的功能和灵活性。通过掌握本文介绍的字符串清洗、转换、提取和匹配等操作，我们可以更加高效地进行字符串数据的处理和分析。无论是数据清洗、特征工程还是数据可视化，Pandas都能为我们提供强大的支持。随着对Pandas的深入学习和实践，我们将能够更好地利用字符串数据来揭示数据的内在规律和价值。在实际应用中，我们还需要结合具体的数据集和业务需求，灵活运用Pandas的各种功能和方法，以实现高效的数据处理和分析。

pandas常用字符串处理方法看这一篇就够了

m0_48891301的博客

09-05

3059

在日常开展数据分析的过程中，我们经常需要对字符串类型数据进行处理，此类过程往往都比较繁琐，而pandas作为表格数据分析利器，其内置的基于Series.str访问器的诸多针对字符串进行处理的方法，以及一些top-level级的内置函数，则可以帮助我们大大提升字符串型数据处理的效率。

Pandas系列学习教程——08 pandas字符串处理

lzylzy66的博客

03-11

1273

随着人工智能的不断发展，数据分析这门技术也越来越重要，很多人都开启了学习数据分析，本文就介绍了pandas学习的基础内容。本章简单介绍了pandas处理字符串的步骤，具体如下。

pandas处理字符串

xueruixuan的专栏

12-03

3144

import pandas as pd df = pd.DataFrame({'name':["test_1", "test_2"]}) 字符串处理之split 问题1：将name列拆为两列 df['name'].str.split('_', expand=True) 这样返回一个DataFrame结构，如果未设置expand，返回时一个Series结构。 字符串处理之extr...

pandas实现列转行

weixin_43806056的博客

11-25

1150

pandas实现列转行

MYSQL列转行

最新发布

04-01

### MySQL 中实现列转行功能在关系型数据库中，列转行通常被称为 **UNPIVOT** 操作。然而，MySQL 并未原生支持 `UNPIVOT` 关键字，因此需要通过其他方法来实现这一需求。以下是几种常见的解决方案： #### 方法一：使用 UNION ALL 实现列转行可以通过手动编写 SQL 查询语句并利用 `UNION ALL` 将每列的数据转化为行的形式。这种方法适用于已知列名的情况。 ```sql SELECT 'column1' AS source_column, column1 AS value FROM your_table WHERE column1 IS NOT NULL UNION ALL SELECT 'column2', column2 FROM your_table WHERE column2 IS NOT NULL UNION ALL SELECT 'column3', column3 FROM your_table WHERE column3 IS NOT NULL; ``` 上述查询会将 `your_table` 表中的 `column1`, `column2`, 和 `column3` 转化为两列表格结构，其中第一列为原始列名，第二列为对应的值[^4]。 --- #### 方法二：动态生成 SQL 语句当列的数量较多或者不确定具体列名时，可以借助存储过程或编程语言（如 Python 或 Shell）动态生成所需的 SQL 语句。以下是一个简单的例子，展示如何通过拼接字符串构建动态 SQL： ```sql SET @sql = NULL; SELECT GROUP_CONCAT( CONCAT('SELECT ''', COLUMN_NAME, ''' AS source_column, ', COLUMN_NAME, ' AS value FROM your_table WHERE ', COLUMN_NAME, ' IS NOT NULL') ) INTO @sql FROM INFORMATION_SCHEMA.COLUMNS WHERE TABLE_NAME = 'your_table'; SET @final_sql = CONCAT('(', REPLACE(@sql, ',', ') UNION ALL ('), ')'); PREPARE stmt FROM @final_sql; EXECUTE stmt; DEALLOCATE PREPARE stmt; ``` 此脚本从 `INFORMATION_SCHEMA.COLUMNS` 动态获取表的列名，并将其组装成类似于方法一所述的 `UNION ALL` 结构[^3]。 --- #### 方法三：引入辅助工具或中间层处理对于复杂场景，也可以考虑将数据导出到外部工具（如 Pandas 库或其他 ETL 工具），完成列转行后再重新导入 MySQL 数据库。这种方式尤其适合大规模数据集或频繁变更的需求。例如，在 Python 的 Pandas 库中可轻松实现该操作： ```python import pandas as pd # 假设 df 是一个 DataFrame 对象 df_melted = pd.melt(df, var_name='source_column', value_name='value') print(df_melted) ``` 随后可通过 SQLAlchemy 或 pymysql 等模块将结果写回 MySQL 数据库。 --- ### 注意事项 - 列转行过程中可能会遇到重复值问题，需提前规划好去重逻辑。 - 如果目标字段存在空值，则应在查询条件中加入过滤器以忽略这些记录。 - 需要确保源表的设计合理，避免因冗余信息导致性能下降。