详解如何使用numpy提高Python数据分析效率-编程学习网

1、数组初始化

数组初始化即创建数组，numpy提供了相当多的创建不同结构的数组的方式，合理的利用这些数据初始化的操作能够让我们的开发事半功倍。

numpy目前最多可以支持三维数组的创建，下面我们直接通过实例来说明其使用技巧。

# 导入数据处理的numpy模块
import numpy as np

# 通过python列表list创建numpy一维数组
array_ = np.array(['a', 'b', 'c'])

# 控制台打印一维数组
print(array_)
# ['a' 'b' 'c']

# 通过python列表list创建numpy二维数组
array_ = np.array([('a', 'b', 'c'), (1, 2, 3)])

# 控制台打印二维数组
print(array_)
# [['a' 'b' 'c']
#  ['1' '2' '3']]

# 创建四行五列的二维数组，并填充值为1，可通过full函数创建任意的二维数组
array_ = np.full((5, 6), 1)

# 控制台打印任意的行、列的二维数组
print(array_)
# [[1 1 1 1 1 1]
#  [1 1 1 1 1 1]
#  [1 1 1 1 1 1]
#  [1 1 1 1 1 1]
#  [1 1 1 1 1 1]]

# 创建任意行、列的二维数组，并且填充值为随机数
array_ = np.random.rand(3, 4)

# 控制台打印随机数的二维数组
print(array_)
# [[0.94372258 0.66743021 0.47003813 0.44912263]
#  [0.71435389 0.47909147 0.52322176 0.32445311]
#  [0.9843635  0.14054129 0.10611754 0.45922036]]

上述便是常用的numpy模块关于数组的初始化方式，灵活应用几种array数组的创建方式能够解决在业务开发过程中的很多问题。

2、数组元素计算

除了numpy的数组的初始化方式，关于numpy数据元素的计算是开发过程中常常会使用的计算方式。

numpy模块提供的很多计算函数不仅简便，而且执行效率更高。有时候比我们自己写的函数运行速度甚至高出几倍不止。

下面就来看看在日常的数据处理过程中常用的几种数据处理函数的使用过程。

# array函数初始化多维度数组
array_ = np.array([(1, 2),
                   (3, 4), (5, 6)])

# sum函数计算多维度数组每一列的和
sum_ = np.sum(array_)

# 打印数组计算结果
print(sum_)
# 21

# mean函数计算多维度数组的平均值
mean_ = np.mean(array_)

# 打印数组计算结果
print(mean_)
# 3.5

# tile函数使元数组变成多行多列的形式，相当于复制的效果
tile_ = np.tile(array_, (3, 4))

# 打印计算结果
print(tile_)
# [[1 2 1 2 1 2 1 2]
#  [3 4 3 4 3 4 3 4]
#  [5 6 5 6 5 6 5 6]
#  [1 2 1 2 1 2 1 2]
#  [3 4 3 4 3 4 3 4]
#  [5 6 5 6 5 6 5 6]
#  [1 2 1 2 1 2 1 2]
#  [3 4 3 4 3 4 3 4]
#  [5 6 5 6 5 6 5 6]]

# 初始化二维数组
array_ = np.array([[3, 6, 4, 11],
                   [5, 10, 1, 3]])

# argsort函数完成对数组的排序操作
argsort_ = array_.argsort()

# 打印计算结果
print(argsort_)
# [[0 2 1 3]
#  [2 3 0 1]]

# argsort函数完成对数组列值的排序操作
argsort_ = array_.argsort(axis=0)

# 打印计算结果
print(argsort_)
# [[0 0 1 1]
#  [1 1 0 0]]

注意：上述的排序结果返回的是源数组的排序后的下标。

除了上述的numpy数组计算的基本操作，最常用的就是下面的numpy数组的加、减、乘、除计算。

通过数组的加、减、乘、除计算能够满足我们在业务开发过程中的绝大多数的计算操作。

# 初始化两个数组a_、b_分别用于下面的逻辑计算
a_ = np.array([1, 2, 3, 4])
b_ = np.array([5, 6, 7, 8])

# 计算两个一维数组的和
result_ = a_ + b_

# 打印计算结果
print(result_)
# [ 6  8 10 12]

# 计算两个一维数组的差
result_ = a_ - b_

# 打印计算结果
print(result_)
# [-4 -4 -4 -4]

# 计算两个一维数组的乘积
result_ = a_ * b_

# 打印计算结果
print(result_)
# [ 5 12 21 32]

# 计算两个一维数组的商
result_ = a_ / b_

# 打印计算结果
print(result_)
# [0.2        0.33333333 0.42857143 0.5       ]

除了上述的一维数组的相关计算，同时numpy还可支持二维矩阵的逻辑计算。

3、数组元素提取

数组元素的提取其实主要还是对数组的下标索引的相关操作。

numpy提供的多维数组同样能够使用对应的索引位置提取出相应的值。

# 初始化二维数组
array_ = np.array([[3, 6, 4, 11],
                   [5, 10, 1, 3]])

# 提取第二行、第四列的值
value_ = array_[1, 3]

# 打印计算结果
print(value_)
# 3

# 提取出倒数第二行、第三列到第四列之间的二维数组
value_ = array_[-2:, 2:3]

# 打印计算结果
print(value_)
# [[4]
#  [1]]

# 获取数组中大于、小于、等于某个数值的结果
result_ = array_ >= 10

# 打印计算结果
print(result_)
# [[False False False  True]
#  [False  True False False]]

# 返回的数组中，所在位置为True的数值就是符合逻辑计算的数值。

多维数组的索引的数值提取操作，能够辅助我们完成更加复杂的数据处理操作。

到此这篇关于详解如何使用numpy提高Python数据分析效率的文章就介绍到这了,更多相关Python numpy提高数据分析效率内容请搜索编程网以前的文章或继续浏览下面的相关文章希望大家以后多多支持编程网！

文章详情

详解如何使用numpy提高Python数据分析效率

目录

1、数组初始化

2、数组元素计算

3、数组元素提取

软考中级精品资料免费领

相关文章

猜你喜欢

详解如何使用numpy提高Python数据分析效率

怎么使用numpy提高Python数据分析效率

Python中NumPy库的优势是什么？如何使用它来提高数据分析的效率？

NumPy 到底能否提高数据分析的效率？

python 详解如何使用GPU大幅提高效率

NumPy中的Python对象如何提高数据处理效率？

Python中的数据类型：如何使用numpy对象来提高代码效率？

numy 数据分析中，如何利用 ASP 函数提高效率？

如何提高Python中Numpy打包接口的使用效率？

如何在Python编程中使用LeetCode和NumPy来提高效率？

Python数据分析之Numpy库的使用详解

在Bash中使用PHP和Numpy：如何提高效率？

IDE中的Python NumPy：如何提高分布式计算效率？

如何在Laravel中利用Python的numpy容器提高数据处理效率？

Python数据分析之NumPy常用函数使用详解

如何在LeetCode中使用Python的NumPy库来提高代码效率？

如何使用工业物联网数据分析将工厂效率提高30%

如何利用 Python 开发技术中的 NumPy 函数提高数据处理效率？

如何使用Go、Django、NumPy和IDE提高编程效率？

NumPy在ASP项目中如何提高数据处理效率？