前言
numpy支持对矩阵和数组进行运算,因此很多numpy的很多运算都需要指定操作的维数参数axis(当然这些axis都有带默认值的),本博客以numpy.sum求和函数为例,具体分析axis参数不同取值下的含义。
先说结论
设 numpy.sum的输入矩阵为a. numpy.sum的返回矩阵为rst.
则矩阵a的形状为:sp=numpy.shape(a),例如sp=[m,n,p,q···]
rst的形状为将sp的第axis个元素设为1,即:
sp'=sp
sp'[axis]=1
numpy.shape(rst)==sp' 为真.
例如:axis=2,
如果a是矩阵则:
rst的形状应该为:[m,n,1,q···]
对于rst的元素rst[m',n',1,q'···]计算方法为:
【注意第axis轴】下标只能取1.
numpy.sum(a,axis=2)的内部计算其实为:
for i in range(sp[axis]):
rst[m'][n'][1][q'][···]+=a[m'][n'][i][q'][···]
结果上发现是第axis维变成1,计算过程其实是对第axis轴进行了遍历,让sp[axis]个元素合并成一个元素。
而如果a是一个array则:
rst的形状应该为:[m,n,q,···]
注意第axis维直接不见了
numpy.sum(a,axis=2)的内部计算
for i in range(sp[axis]):
rst[m'][n'][q'][···]+=a[m'][n'][i][q'][···]
结果上发现是第axis维变没了,计算过程其实是对第axis轴进行了遍历,让sp[axis]个元素合并成一个元素。
举例说明
简单点的
import numpy as np
a=np.mat([[1,2,3],[4,5,6]])
a的shape:
print (np.shape(a))
输出:(2, 3)
计算:np.sum(a,axis=0)
>>> s0=np.sum(a,axis=0)
>>> s0
matrix([[5, 7, 9]])
按照【先说结论】的方法:
axis=0
a的形状:(2,3)
所以rst的形状为:(1,3)
对于rst的每个元素p,q:
rst[p][q] 的 计算方法为(其中p只能等于0,q=0,1,2):
for i in range(np.shape(a)[axis]):
rst[0][q]+=a[i][q]
所以:
rst[0][0]=a[0][0]+a[1][0]=1+4=5
rst[0][1]=a[0][1]+a[1][1]=2+5=7
rst[0][2]=a[0][2]+a[1][2]=3+6=9
所以rst就是[[5,7,9]]
计算 numpy.sum(a,axis=1)
a=[[1,2,3],[4,5,6]
>>> s1=np.sum(a,axis=1)
>>> s1
matrix([[ 6],
[15]])
>>> np.shape(s1)
(2, 1)
>>>
一样的分析方法:
按照【先说结论】的方法:
axis=1
a的形状:(2,3)
所以rst的形状为:(2,1)
对于rst的每个元素p,q:
rst[p][q] 的 计算方法为(其中p=0,1 ,而q只能为0):
for i in range(np.shape(a)[axis]):
rst[p][0]+=a[p][i]
所以:
rst[0][0]=a[0][0]+a[0][1]+a[0][2]=1+2+3=6
rst[1][0]=a[1][1]+a[1][1]+a[1][2]=4+5+6=15
所以rst就是[[6],[15]].
复杂点的:
>>> b=np.array([[[1,2,3],[4,5,6],[7,8,9]]])
>>> b
array([[[1, 2, 3],
[4, 5, 6],
[7, 8, 9]]])
>>> np.shape(b)
(1, 3, 3)
b是1x3x3,是一个array.
那么np.sum(b,axis=2)等于多少呢?
标准答案:
>>> print (np.sum(b,axis=2))
[[ 6 15 24]]
分析结果:
返回值应该为1x3形状的array,对于元素rst[p][q].
rst[p][q]=a[p][q][0]+a[p][q][1]+a[p][q][2]
例如rst[0][1]=a[0][1][0]+a[0][1][1]+a[0][1][2]=8+5+6=15.
而np.sum(b,axis=2)的第一行第二个元素正是 15.
关于axis默认值
一般此类针对矩阵、array的函数都有一个axis参数,并且此默认为None.当axis为None使 表示运算是遍历矩阵(array)的每一个元素的,是逐元素的计算。
补充:python中某些函数axis参数的理解
总结为一句话:
设axis=i,则numpy沿着第i个下标变化的方向进行操作。
当然,这个i是从0开始数的,作为程序员的你一定不会搞错。
axis意为“轴”,它指定了函数在张量(矩阵、等等)上进行操作的方向。
例如有一个ndarray,名叫A,A.shape=(3,8,5,7)。
那么np.sum(A, axis=2)计算的结果的shape就是(3,8,7)。
假设这个shape是(3,8,7)的ndarray变量名为B,那么实际上:
B[i][j][k]=A[i][j][0][k]+A[i][j][1][k]+A[i][j][2][k]+A[i][j][3][k]+A[i][j][4][k]
以下代码你可以自己跑一下试试:
import numpy as np
A=np.random.randn(3,8,5,7)
print("A.shape=",A.shape)
B=np.sum(A,axis=2)
print("B.shape=",B.shape)
预期输出为:
A.shape= (3, 8, 5, 7)
B.shape= (3, 8, 7)
以上为个人经验,希望能给大家一个参考,也希望大家多多支持编程网。