基本数据类型和数组
NumPy 的核心数据结构是多维数组,称为 ndarray。ndarray 存储相同数据类型的值,并且可以具有任意数量的维度。NumPy 支持各种基本数据类型,包括整数、浮点数、布尔值和复数。
数组操作
NumPy 提供了一系列数组操作函数,可以高效地执行各种操作,包括:
- 算术运算(加法、减法、乘法、除法)
- 比较运算(等于、不等于、大于、小于)
- 逻辑运算(AND、OR、NOT)
- 广播(将标量或低维数组推广到高维数组)
线性代数
NumPy 提供了强大的线性代数功能,包括:
- 矩阵乘法、求逆和行列式计算
- 解线性方程组
- 求解特征值和特征向量
统计运算
NumPy 提供了一组统计运算函数,用于计算统计值,例如:
- 均值、中位数、标准差
- 累积和、最大值、最小值
- 直方图和频率分布
随机数生成
NumPy 提供了各种随机数生成器,可生成遵循不同分布的随机数,例如:
- 均匀分布
- 正态分布
- 二项分布
文件输入/输出
NumPy 可以轻松地从文件和数据库中加载和保存数据。它支持广泛的文件格式,包括:
- CSV(逗号分隔值)
- TXT(文本)
- HDF5(分层数据格式)
集成与其他库
NumPy 与其他流行的 Python 库高度集成,包括:
- Matplotlib:用于数据可视化
- Pandas:用于数据处理和分析
- Scikit-learn:用于机器学习
应用
NumPy 在广泛的领域中都有应用,包括:
- 科学计算
- 数据分析
- 机器学习
- 图像处理
- 信号处理
优势
NumPy 凭借以下优势成为数据处理中的首选工具:
- 高性能,利用底层编译代码
- 简洁的语法,易于使用
- 广泛的函数集,涵盖各种操作
- 与其他库的高度集成,提高了可扩展性