1. 安装 NumPy
通过 pip 命令在终端中安装 NumPy:
pip install numpy
2. 导入 NumPy
在 Python 脚本中导入 NumPy 模块:
import numpy as np
3. 创建和操作数组
NumPy 的核心数据结构是 ndarray,可以创建一维、二维甚至更高维的数组:
# 创建一维数组
arr = np.array([1, 2, 3, 4, 5])
# 创建二维数组
matrix = np.array([[1, 2, 3], [4, 5, 6]])
4. 数组属性和方法
NumPy 数组具有各种属性和方法来操纵和分析数据:
- shape:数组的形状(维度和大小)
- dtype:数组中的元素类型
- reshape:改变数组的形状
- transpose:转置数组
- sum:计算数组元素的总和
- mean:计算数组元素的平均值
5. 数组索引和切片
NumPy 提供了灵活的索引和切片机制,可以轻松地访问和修改数组元素:
# 访问元素
print(arr[2])
# 切片
print(matrix[:, 1:])
6. 基本数学运算
NumPy 支持对数组进行基本数学运算,例如加减乘除:
# 加法
result = arr + 1
# 乘法
product = matrix * 2
7. 数据广播
NumPy 中的数据广播允许在不同形状的数组上执行数学运算,从而简化了处理大型数据集:
# 将标量广播到数组
print(arr + 5)
# 广播数组
print(matrix + arr)
8. 文件输入/输出
NumPy 可以通过 np.load 和 np.save 函数轻松地从文件加载和保存数组:
# 从文件中加载数组
data = np.load("data.npy")
# 保存数组到文件
np.save("output.npy", data)
9. 性能优化
NumPy 针对大型数组的性能进行了优化,可以通过使用矢量化操作和 NumPy 特定的函数来进一步提升效率:
- 使用向量化操作代替循环
- 避免不必要的数组复制
- 利用 NumPy 的并行化函数
10. 进阶功能
除了基本操作之外,NumPy 还提供了更高级的功能,例如:
- 线性代数运算
- 傅里叶变换
- 随机数生成
- 图像处理
通过掌握这些核心概念,初学者可以快速入门 NumPy,并在数据处理和分析领域如虎添翼。