pythonnumpy和pandas的使用

在数据分析和处理领域,Python 的 NumPy 和 Pandas 库是两个非常重要的工具,NumPy 提供了高性能的多维数组对象以及用于处理这些数组的工具,而 Pandas 是基于 NumPy 构建的,提供了易于使用的数据结构和数据分析工具,接下来,我会详细介绍如何使用这两个库。

pythonnumpy和pandas的使用
(图片来源网络,侵删)

NumPy 的使用

安装 NumPy

你需要安装 NumPy,可以使用 pip 命令进行安装:

pip install numpy

创建数组

NumPy 的核心是 ndarray 对象,这是一个多维数组,你可以使用 numpy.array() 函数创建一个数组:

import numpy as np
arr = np.array([1, 2, 3, 4, 5])
print(arr)

数组操作

NumPy 提供了大量的数组操作函数,例如求和、平均值、最大值、最小值等:

print(np.sum(arr))      # 求和
print(np.mean(arr))     # 平均值
print(np.max(arr))      # 最大值
print(np.min(arr))      # 最小值

Pandas 的使用

安装 Pandas

同样,你需要先安装 Pandas:

pip install pandas

创建 DataFrame

Pandas 的核心数据结构是 DataFrame,这是一个二维表格型数据结构,你可以使用 pandas.DataFrame() 函数创建一个 DataFrame:

import pandas as pd
data = {
    '姓名': ['张三', '李四', '王五'],
    '年龄': [25, 30, 35],
    '城市': ['北京', '上海', '深圳']
}
df = pd.DataFrame(data)
print(df)

数据操作

Pandas 提供了丰富的数据操作方法,例如筛选、排序、分组等:

筛选年龄大于等于30的行
filtered_df = df[df['年龄'] >= 30]
print(filtered_df)
按年龄排序
sorted_df = df.sort_values(by='年龄')
print(sorted_df)
按城市分组,计算每组的平均年龄
grouped_df = df.groupby('城市')['年龄'].mean()
print(grouped_df)

以上就是 Python 中 NumPy 和 Pandas 的基本使用方法,在实际工作中,你可能需要根据具体需求灵活运用这两个库的功能,希望对你有所帮助!

原创文章,作者:酷盾叔,如若转载,请注明出处:https://www.kdun.com/ask/308313.html

本网站发布或转载的文章及图片均来自网络,其原创性以及文中表达的观点和判断不代表本网站。如有问题,请联系客服处理。

(0)
酷盾叔订阅
上一篇 2024-03-04 19:21
下一篇 2024-03-04 19:22

相关推荐

发表回复

您的电子邮箱地址不会被公开。 必填项已用 * 标注

产品购买 QQ咨询 微信咨询 SEO优化
分享本页
返回顶部
云产品限时秒杀。精选云产品高防服务器,20M大带宽限量抢购 >>点击进入