pd.DataFrame函数的介绍

### pandas DataFrame 函数使用介绍 #### 1. DataFrame 的基本定义 Pandas 中的 DataFrame 是一种带有标签轴（行和列）的二维大小可变的数据结构，可以处理异构的表格数据。它类似于 Excel 表格或 SQL 表格，支持算术运算并对齐行和列标签[^2]。 #### 2. 创建 DataFrame 的方法可以通过多种方式创建 DataFrame，包括字典、Numpy 数组、Series 对象等。以下是常见的创建方式： - **通过字典创建**： ```python import pandas as pd data = {'A': [1, 2, 3], 'B': [4, 5, 6]} df = pd.DataFrame(data) print(df) ``` - **通过 Numpy 数组创建**： ```python import numpy as np import pandas as pd data = np.array([[1, 2, 3], [4, 5, 6]]) df = pd.DataFrame(data, columns=['A', 'B', 'C']) print(df) ``` - **通过 Series 对象创建**： ```python import pandas as pd data = {'A': pd.Series([1, 2, 3]), 'B': pd.Series([4, 5, 6])} df = pd.DataFrame(data) print(df) ``` #### 3. 常用属性以下是一些常用的 DataFrame 属性[^2]： - **`df.shape`**：返回 DataFrame 的形状（行数和列数）。 - **`df.columns`**：返回 DataFrame 的列名。 - **`df.index`**：返回 DataFrame 的索引。 - **`df.dtypes`**：返回每列的数据类型。示例代码： ```python import pandas as pd data = {'A': [1, 2, 3], 'B': [4, 5, 6]} df = pd.DataFrame(data) print("Shape:", df.shape) # 输出形状 print("Columns:", df.columns) # 输出列名 print("Index:", df.index) # 输出索引 print("Data Types:", df.dtypes) # 输出数据类型 ``` #### 4. 常用操作函数以下是一些常用的 DataFrame 操作函数： - **`df.head(n)`**：返回前 n 行数据。 - **`df.tail(n)`**：返回后 n 行数据。 - **`df.describe()`**：生成数值列的描述性统计信息。 - **`df.info()`**：显示 DataFrame 的简要信息。 - **`df.isnull()`**：检查缺失值。 - **`df.dropna()`**：删除包含缺失值的行或列。 - **`df.fillna(value)`**：用指定值填充缺失值。示例代码： ```python import pandas as pd data = {'A': [1, 2, None], 'B': [4, None, 6]} df = pd.DataFrame(data) print("Head:\n", df.head(2)) # 输出前两行 print("Describe:\n", df.describe()) # 描述性统计 print("Is Null:\n", df.isnull()) # 检查缺失值 print("Drop NA:\n", df.dropna()) # 删除缺失值 print("Fill NA:\n", df.fillna(0)) # 填充缺失值 ``` #### 5. 数据筛选与过滤可以通过布尔索引对 DataFrame 进行筛选和过滤[^2]。示例代码： ```python import pandas as pd data = {'A': [1, 2, 3], 'B': [4, 5, 6]} df = pd.DataFrame(data) # 筛选 A 列大于 1 的行 filtered_df = df[df['A'] > 1] print(filtered_df) ``` #### 6. 数据排序可以使用 `sort_values` 和 `sort_index` 方法对 DataFrame 进行排序。示例代码： ```python import pandas as pd data = {'A': [3, 1, 2], 'B': [6, 4, 5]} df = pd.DataFrame(data) # 按 A 列升序排序 sorted_df = df.sort_values('A') print(sorted_df) # 按索引降序排序 sorted_index_df = df.sort_index(ascending=False) print(sorted_index_df) ``` #### 7. 元素比较可以使用 `ne` 方法对 DataFrame 元素进行不等式比较[^3]。示例代码： ```python import pandas as pd data = {'A': [1, 2, 3], 'B': [1, 2, 4]} df = pd.DataFrame(data) # 比较 A 列与 B 列是否相等 comparison = df['A'].ne(df['B']) print(comparison) ```

阅读全文

pd.DataFrame函数的介绍

相关推荐

python pandas.DataFrame.loc函数使用详解

pd.DataFrame统计各列数值多少的实例

基于python计算滚动方差(标准差)talib和pd.rolling函数差异详解

pd.DataFrame函数

python pd.dataframe函数

pd.DataFrame函数中的columns

pd.DataFrame输入指定行数的pd.DataFrame

pd.DataFrame函数创建一个excel表格的第一列

def combine_two_tables(person: pd.DataFrame, address: pd.DataFrame) -> pd.DataFrame:

不按照顺序，pd.DataFrame输入指定行数的pd.DataFrame

pd.concat([pd.DataFrame(wine.data),pd.DataFrame(wine.target)],axis = 1)

def find_products(products: pd.DataFrame) -> pd.DataFrame:

print(pd.concat([pd.DataFrame(wine.data),pd.DataFrame(wine.target)],axis=1))

df_concat_x = pd.DataFrame() df_concat_y=pd.DataFrame() df_concat_x1=pd.DataFrame() df_concat_y1=pd.DataFrame()如何代码更简洁

print(pd.concat([pd.DataFrame(names),pd.DataFrame(lr_fit.coef_).T],axis=1))

def big_countries(world: pd.DataFrame) -> pd.DataFrame:是什么意思

pd.dataframe()函数

def save_csv(data): df = pd.DataFrame(pd.read_csv("data.csv")) df1 = pd.DataFrame(data, index=[0]) df2 = pd.concat([df, df1]) df2.to_csv("data.csv")

load = pyqtSignal(pd.DataFrame)函数啥功能

pd.dataframe()函数通过字典

大家在看

离心泵特性曲线计算程序VB源代码包

python的预测房价模型组合代码.zip

中国检查徽章背景的检察机关PPT模板

WinUSB4NuVCOM_NUC970+NuWriter.rar

indonesia-geojson:印度尼西亚GEOJSON文件收集

最新推荐

基于python计算滚动方差(标准差)talib和pd.rolling函数差异详解

12月英语网络统考复习资料2-作文范文汇总.doc

15利用公共密钥基础结构配置网络安全性.ppt

1云金融-任务三-云计算带来的金融变革和发展趋势.pptx

前端分析-202307110078988

构建基于ajax, jsp, Hibernate的博客网站源码解析

【Unity Sunny Land关卡设计高级指南】：打造完美关卡的8大技巧

C++ 模版

C#随机数摇奖系统功能及隐藏开关揭秘

【数据驱动的力量】：管道缺陷判别方法论与实践经验