熊猫数据框

内容

Pandas 是一个开源的 Python 库,提供高性能、易于使用的数据结构和数据分析工具。在其核心产品中,Pandas DataFrame 是 Pandas 中最重要的数据结构之一。它本质上是一个二维标记数据结构,具有可能不同类型数据的列。在本文中,我们将通过全面的示例探讨 Pandas DataFrame 的各种功能。

Pandas DataFrame 推荐文章

1. 创建一个 Pandas DataFrame

在使用 Pandas 时,最基本的操作之一是创建 Pandas DataFrame。您可以从各种数据源创建 Pandas DataFrame,例如列表、字典,甚至是外部数据文件。

示例 1:从列表创建 Pandas DataFrame

导入 pandas 作为 pd
data = [['亚历克斯', 10], ['鲍勃', 12], ['克拉克', 13]]
df = pd.DataFrame(data, columns=['姓名', '年龄'])
print(df)

输出:

Pandas DataFrame

示例 2:从字典创建 Pandas DataFrame

导入 pandas 作为 pd
data = {'姓名': ['汤姆', '杰克', '史蒂夫', '里基'],
        '年龄': [28, 34, 29, 42]}
df = pd.DataFrame(data)
print(df)

输出:

Pandas DataFrame

  1. 在Pandas DataFrame中读取和写入数据

Pandas 支持从不同的数据格式读取和写入,包括 CSV、Excel、SQL 数据库等。

示例 3:从 CSV 读取数据

导入 pandas 作为 pd
df = pd.read_csv('pandasdataframe.com_data.csv')
print(df)

示例 4:写入数据到 Excel

导入 pandas 作为 pd
df = pd.DataFrame({'数据': [10, 20, 30, 20, 15, 30, 45]})
df.to_excel('pandasdataframe.com_output.xlsx', index=False)

3. 在Pandas DataFrame中的数据选择、添加和删除

有效使用Pandas的核心是操作数据。您可以在Pandas DataFrame中选择、添加或删除数据。

示例 5:在 Pandas DataFrame 中按列选择数据

导入 pandas 作为 pd
data = {'姓名': ['汤姆', '杰瑞', '米老鼠', '唐老鸭'],
        '年龄': [25, 30, 35, 40]}
df = pd.DataFrame(data)
print(df['姓名'])

输出:

Pandas DataFrame

示例 6:在 Pandas DataFrame 中添加新列

导入 pandas 作为 pd
df = pd.DataFrame({'姓名': ['汤姆', '杰克', '史蒂夫', '里基'],
                   '年龄': [28, 34, 29, 42]})
df['薪资'] = [1000, 1500, 1200, 1800]
print(df)
总结
Pandas是一个开源的Python库,提供高性能、易用的数据结构和数据分析工具。其中,Pandas DataFrame是最重要的数据结构之一,具有二维标签数据结构的特性,支持不同类型的数据。本文探讨了Pandas DataFrame的多种功能,包括创建DataFrame、读取和写入数据、数据选择、添加和删除、处理缺失数据、执行算术运算、应用函数、分组和聚合数据,以及合并和连接DataFrame。通过示例,展示了如何从列表和字典创建DataFrame,如何读取CSV文件和写入Excel文件,如何选择、添加和删除列,如何处理缺失数据,以及如何进行数据分组和聚合操作。此外,还介绍了如何合并和连接多个DataFrame,展示了Pandas在数据分析中的强大功能和灵活性。