一、NumPy简介:
NumPy是Python中用于科学计算和数据分析的强大库,提供了一系列高效且易用的工具,能够轻松处理多维数组并执行各种数学运算。NumPy的基础数据结构是多维数组ndarray,可以存储不同类型的数据,例如数字、字符串和布尔值。
二、数组操作:
NumPy提供了丰富的数组操作函数,可以对数组进行各种操作,包括切片、索引、广播、排序、连接和重塑。这些操作非常高效,且易于使用,大大简化了数据操作。
import numpy as np
# 创建一个数组
arr = np.array([1, 2, 3, 4, 5])
# 切片
print(arr[1:3]) # 输出:[2 3]
# 索引
print(arr[2]) # 输出:3
# 广播
print(arr + 10) # 输出:[11 12 13 14 15]
# 排序
print(np.sort(arr)) # 输出:[1 2 3 4 5]
# 连接
print(np.concatenate((arr, arr))) # 输出:[1 2 3 4 5 1 2 3 4 5]
# 重塑
print(arr.reshape((2, 2))) # 输出:[[1 2]
# [3 4]]
三、数学运算:
NumPy提供了丰富的数学运算函数,可以对数组执行各种数学运算,包括加减乘除、指数、对数、三角函数、统计函数等。这些函数非常高效,支持广播操作,极大地方便了数据分析和科学计算。
import numpy as np
# 加减乘除
print(np.add(arr, 10)) # 输出:[11 12 13 14 15]
print(np.subtract(arr, 10)) # 输出:[-9 -8 -7 -6 -5]
print(np.multiply(arr, 10)) # 输出:[ 10 20 30 40 50]
print(np.divide(arr, 10)) # 输出:[0.1 0.2 0.3 0.4 0.5]
# 指数、对数、三角函数
print(np.exp(arr)) # 输出:[ 2.71828183 7.3890561 20.08553692
# 54.59815003 148.41315911]
print(np.log(arr)) # 输出:[ 0. 1.09861229 1.38629436
# 1.60943791 1.79175947]
print(np.sin(arr)) # 输出:[ 0.84147098 0.90929743 0.14112001
# -0.7568025 0.95892427]
# 统计函数
print(np.sum(arr)) # 输出:15
print(np.mean(arr)) # 输出:3.0
print(np.std(arr)) # 输出:1.58113883
四、数据聚合:
NumPy提供了丰富的聚合函数,可以对数组中的数据进行聚合操作,包括求和、求平均值、求最大值、求最小值、求中位数、求方差等。这些聚合函数非常高效,且支持广播操作,使您能够轻松地对大型数据集进行聚合分析。
import numpy as np
# 求和
print(np.sum(arr)) # 输出:15
# 求平均值
print(np.mean(arr)) # 输出:3.0
# 求最大值
print(np.max(arr)) # 输出:5
# 求最小值
print(np.min(arr)) # 输出:1
# 求中位数
print(np.median(arr)) # 输出:3.0
# 求方差
print(np.var(arr)) # 输出:2.5