说在最前
不知道小伙伴们在写代码的时候有没有区分开numpy.abs和abs函数,别小看这两个函数,如果在写程序的时候正确区分使用这两个函数可以使自己的程序运行效率大大提升。
别看这两个函数都能对整数求绝对值,但他们俩的返回值类型完全不一样,如果傻傻地混为一谈,将会使你的程序运行时间被大大拖累!
今天笔者就带小伙伴们看看,这两个函数究竟该怎么正确使用才能使自己的程序运行效率得到提升。
先看示例程序-abs()函数
注意观察变量row和语句temp=row-1
import time
row=-1000
row=abs(row) #这里的函数是abs()
start_time = time.time()#记录程序运行到这(记为A)的时间
for i in range(row):
for j in range(1000):
temp=row-1 #temp在这里只是用来接收row-1的结果
end_time = time.time()#记录程序运行到这(记为B)的时间
print(end_time-start_time)#输出A和B代码间的程序运行时间
运行时间为:0.08079314231872559
再看示例程序-numpy.abs()函数
注意观察变量row和语句temp=row-1
import numpy
import time
row=-1000
row=numpy.abs(row) #这里的函数是numpy.abs()
start_time = time.time()#记录程序运行到这(记为A)的时间
for i in range(row):
for j in range(1000):
temp=row-1 #temp在这里只是用来接收row-1的结果
end_time = time.time()#记录程序运行到这(记为B)的时间
print(end_time-start_time)#输出A和B代码间的程序运行时间
运行时间为:0.20246124267578125
观察两个程序的结果
观察两个程序的相同代码段运行时间的结果,你会发现作用都是用来取整的abs()函数和numpy.abs()函数,运行时间竟然差了大约2.5倍!
小伙伴们看到这里是不是十分惊讶和不解?为什么相同的代码段运行时间竟然大不相同?虽然在本文章中,它们的相同代码段运行时间只差了0点几秒,但是在做数据处理时,庞大的数据处理足足可以使这微小的差距瞬间拉大,造成本来可以几秒钟运行结束的程序你却用了几分钟跑完的尴尬局面。
分析解释
注意观察两个程序的变量row,
第一个程序
row=abs(row)
第二个程序
row=numpy.abs(row)
小伙伴们第一眼看好像这两个函数除了外貌不同外,也没啥不同,都是对变量row取绝对值,但是这两个函数恰恰在返回值类型上不同。abs()函数返回的类型是int型而numpy.abs()函数返回的类型却是ndarray。小伙伴们可以使用Type()函数来看变量row的类型,或者去numpy的官网看一下numpy.abs()函数的说明,链接附上:numpy.abs()函数官方说明
int类型这里不做过多解释,有兴趣的小伙伴可以自己去了解相关知识。
而ndarray类型,是numpy库里的数组类型,它是numpy库里的一种类(numpy.ndarray),小伙伴们可以去官网上看看有关ndarray类型的说明。链接附上:numpy.ndarray类型官方说明
有了上面的基础,我们再来理解为什么会出现相同代码段运行时间不同就变得容易许多了。其主要原因在于
temp=row-1
这段代码。如果row变量是ndarray类型,那么ndarray类型减去int类型(常量1是int类型)就会存在不同类型间的变量进行转换的问题(这种转换是系统自己完成的,也可以称之为隐藏式地转换),这会使程序有额外的开销,使程序的运行效率降低。而如果row变量是int类型就不会出现这种问题,所以这就是使两段相同的代码运行时间不同的根本原因所在。
另外numpy.abs()函数希望的参数类型是ndarray类型,而abs()函数希望的参数类型之一是int类型,所以numpy.abs(row)和abs(row)也存在上述问题。
拓展
虽然numpy.abs()函数对单个元素(整型、浮点型等等)的处理较abs()函数慢,但如果元素很多,可以把这些元素组合起来形成一个ndarray类型数组,这时使用numpy.abs()函数(ndarray类型做实际参数)就要比用abs()函数循环处理快得多啦。
补充:numpy abs()报错
我在用numpy的abs()给数组取绝对值的时候出现了这个问题,很明显是dtype的问题
'<U32'是unsigned 32的含义,那么这个格式本来就没有符号,我还非要取绝对值那肯定会报错的呀!
回过头去看了看果然是append进数组的时候忘了把格式强转成float了
OK!转换!解决!
ufunc 'absolute' did not contain a loop with signature matching types dtype('<U32') dtype('<U32')
总结
单个元素用abs()函数
多个元素并行处理用numpy.abs()函数
使用函数和写代码时一定要注意变量隐藏式地转换,因为这能在无形之中拖慢你程序的运行速度。
到此这篇关于Python中numpy.abs和abs函数的文章就介绍到这了,更多相关Python numpy.abs和abs函数内容请搜索编程网以前的文章或继续浏览下面的相关文章希望大家以后多多支持编程网!