在写python程序时,对于可变对象和不可变对象这里理解不深,导致总会犯一些细节错误。以下面的程序举例:
ab = {'a':1, 'b':2}
list1 = []
for i in range(2,5):
ab['a'] = i
list1.append(ab)
print(list1) # [{'a': 4, 'b': 2}, {'a': 4, 'b': 2}, {'a': 4, 'b': 2}]
这段代码本以为结果应该是[{‘a': 2, ‘b': 2}, {‘a': 3, ‘b': 2}, {‘a': 4, ‘b': 2}],但是列表中的每一个字典里键a的值都变成了最后一次的值4。这就涉及到了python中的可变对象和不可变对象的相关知识。
首先,什么是对象呢?
在python中,一切皆对象,对象必有的三个属性:地址、类型、值
当 a=5时,其实就是一个创建和引用的过程。首先创建一个对象5,5被存在内存中,有自己独立的一块地址空间,然后a指向(引用)了5。
可变对象与不可变对象
当对象的值发生变化,但内存地址没有改变时,则说明是可变类型
当对象的值发生变化,内存地址也发生改变时,则说明是不可变类型
众所周知,python里的可变对象有:列表、字典、集合
不可变对象有:元组、字符串、数值
以下代码可以更好地解释可变对象与不可变对象:
python在引用不可变对象时,会寻找该对象是否被创建过,若该对象已创建,则变量会直接引用该对象,不会再申请新的内存空间。
a = 5
b = 5
# 此时a和b都引用了对象5,所以地址一样
print(id(a), id(b)) # 1662825664 1662825664
# 对象发生了变化,a改变了引用,地址也发生了变化
a = 6
print(id(a), id(b)) # 1662825696 1662825664
引用可变对象时,会创建新的内存地址,当可变对象值发生改变时,原内存地址不会改变
list1 = [1,2,3,4]
list2 = [1,2,3,4]
print(id(list1), id(list2)) #1754039591880 1754040417288
list1.append(5)
print(id(list1), id(list2)) #1754039591880 1754040417288
注意:如果直接将list2 = list1,那么list1和list2的地址会是相同的。只是换了不同的名称而已。
list1 = [1,2,3,4]
list2 = list1
print(id(list1), id(list2)) #2272617112520 2272617112520
list1.append(5)
print(id(list1), id(list2)) # 2272617112520 2272617112520
那么为什么列表是可变的,而字符串或数值型是不可变的呢?这要深究到python数据类型的底层实现。
List底层
List通过引用数组实现列表元素的存储
简单来说,就是列表中开辟了一块连续的地址空间,用来存储引用元素的地址。所以列表中存储的是地址,而不是具体的值。
字典底层
通过稀疏数组 实现值的存储与访问
1.字典的创建过程
- 创建一个散列表(稀疏数组,可以动态扩充)
- 通过hash()计算键的散列值
- 根据计算的散列值确定其在散列表中的位置
- 在该位置上存入值
2.字典的访问过程
- 计算要访问的键的散列值
- 根据计算的散列值,按照一定的规则,确定其在散列表中的位置
- 读取该位置上存储的值
字符串底层
通过紧凑数组实现字符串的存储
字符串数据在内存中是连续存放的,空间利用率高。因此,字符串是不可变类型。
原因是:每个字符的大小是固定的,因此一个字符串的大小也是固定的,可以分配一个固定大小的空间给字符串。
再补充一些关于函数传递参数的方式
值传递
主函数向调用函数传递的参数是不可变类型时,实际上只是将实参的拷贝(即临时副本)传递给了被调用函数,并不是实参本身,这样被调函数不能直接修改主调函数中变量的值,而只能修改其私有的临时副本的值。
引用传递
主函数向调用函数传递的参数是可变类型时,实际上是将实参的引用传入了调用函数,对引用的操作等于对其指定的对象进行操作。
注意以下两种情况:
list1 = [1,2,3,4]
def solution(list1):
list1 = [1,2,3,4,5]
return list1
solution(list1)
print(list1) # [1,2,3,4]
list1 = [1,2,3,4]
def solution(list1):
list1.append(5)
return list1
solution(list1)
print(list1) # [1,2,3,4,5]
第一种,在函数内部用了"=" ,其实就相当于重新创建了一块内存存放新的对象,将list1指向了新的对象,所以并没有改变全局中的list1
第二种,使用append,即改变原对象的值,因此还是对原对象的操作。
参考:
Python 类、对象、数据分类、函数参数传递的理解
一篇文章教你掌握python数据类型的底层实现
总结
本篇文章就到这里了,希望能够给你带来帮助,也希望您能够多多关注编程网的更多内容!