Pandas 是一个开源的 Python 库,提供高性能、易于使用的数据结构和数据分析工具。在其核心产品中,Pandas DataFrame 是 Pandas 中最重要的数据结构之一。它本质上是一个二维标记数据结构,具有可能不同类型数据的列。在本文中,我们将通过全面的示例探讨 Pandas DataFrame 的各种功能。
Pandas DataFrame 推荐文章
1. 创建一个 Pandas DataFrame
在使用 Pandas 时,最基本的操作之一是创建 Pandas DataFrame。您可以从各种数据源创建 Pandas DataFrame,例如列表、字典,甚至是外部数据文件。
示例 1:从列表创建 Pandas DataFrame
导入 pandas 作为 pd
data = [['亚历克斯', 10], ['鲍勃', 12], ['克拉克', 13]]
df = pd.DataFrame(data, columns=['姓名', '年龄'])
print(df)
输出:
示例 2:从字典创建 Pandas DataFrame
导入 pandas 作为 pd
data = {'姓名': ['汤姆', '杰克', '史蒂夫', '里基'],
'年龄': [28, 34, 29, 42]}
df = pd.DataFrame(data)
print(df)
输出:
- 在Pandas DataFrame中读取和写入数据
Pandas 支持从不同的数据格式读取和写入,包括 CSV、Excel、SQL 数据库等。
示例 3:从 CSV 读取数据
导入 pandas 作为 pd
df = pd.read_csv('pandasdataframe.com_data.csv')
print(df)
示例 4:写入数据到 Excel
导入 pandas 作为 pd
df = pd.DataFrame({'数据': [10, 20, 30, 20, 15, 30, 45]})
df.to_excel('pandasdataframe.com_output.xlsx', index=False)
3. 在Pandas DataFrame中的数据选择、添加和删除
有效使用Pandas的核心是操作数据。您可以在Pandas DataFrame中选择、添加或删除数据。
示例 5:在 Pandas DataFrame 中按列选择数据
导入 pandas 作为 pd
data = {'姓名': ['汤姆', '杰瑞', '米老鼠', '唐老鸭'],
'年龄': [25, 30, 35, 40]}
df = pd.DataFrame(data)
print(df['姓名'])
输出:
示例 6:在 Pandas DataFrame 中添加新列
导入 pandas 作为 pd
df = pd.DataFrame({'姓名': ['汤姆', '杰克', '史蒂夫', '里基'],
'年龄': [28, 34, 29, 42]})
df['薪资'] = [1000, 1500, 1200, 1800]
print(df)