1 概述
对于Python这样的动态语言,如何高效的管理内存,是很重要的一部分,在很大程度上决定了Python的执行效率。与大多数编程语言不同,Python中的变量无需事先申明,变量无需指定类型,程序员无需关心内存管理,Python解释器给你自动回收。我们知道在变量分配内存时,是借用系统资源,在使用完成后,应该归还所借用的系统资源,Python承担了这个复杂的内存管理工作,从而让程序员更加的关注程序的编写质量上。
在执行过程中,Python会频繁的创建和销毁大量的对象,这些都涉及到内存的管理。以下从三个方面来分析Python是如何进行内存管理的。
2 对象的引用计数机制
在Python中是通过引用计数来保持对内存中的变量追踪的,也就是做Python内部记录中所有在使用对象各有多少个引用。Python中有个内部跟踪变量叫做引用计数器,每个变量有多少个引用,简称引用计数。当某个对象的引用计数为0时,就列入了垃圾回收队列。
引用计数增加的情况:
1. 一个对象分配一个新名称
2. 将其放入一个容器中(如列表、元组或字典)
引用计数减少的情况:
1. 使用del语句对对象别名显式的销毁
2. 引用超出作用域或被重新赋值
sys.getrefcount( )函数可以获得对象的当前引用计数
多数情况下,引用计数比你猜测得要大得多。对于不可变数据(如数字和字符串),解释器会在程序的不同部分共享内存,以便节约内存。
3 垃圾回收机制
3.1 当一个对象的引用计数归零时,与该对象对应的析构函数就会被调用,但调用析构函数并不意味着最终一定要调用free释放内存空间,通常是将该对象通过垃圾收集机制处理,将其占用的空间归还到内存池中。
3.2 当两个对象a和b相互引用时,del语句可以减少a和b的引用计数,并销毁用于引用底层对象的名称。然而由于每个对象都包含一个对其他对象的应用,因此引用计数不会归零,对象也不会销毁。(从而导致内存泄露)。为解决这一问题,解释器会定期执行一个循环检测器,搜索不可访问对象的循环并删除它们。
4 内存池机制
Python提供了对内存的垃圾回收机制,但是它将不用的内存放到内存池而不是返回给操作系统。
4.1 小块内存池机制Pymalloc机制
在Python中,许多时候申请的内存都是小块的内存,这些小块内存在申请后,很快又会被释放,由于这些内存的申请并不是为了创建对象,所以并没有对象一级的内存池机制。这就意味着在运行期间,Python会大量的执行malloc和free操作。为了加速Python的执行效率,Python引入了一个内存池机制,用于管理对小块内存的申请和释放,即Pymalloc机制。
1. 当申请的内存小于256字节时,PyObject_Malloc会在内存池中申请内存;当申请的内存大于256字节时,PyObject_Malloc的行为将蜕化为malloc的行为。当然,通过修改Python源代码,我们可以改变这个默认值,从而改变Python的默认内存管理行为。
2. 对于Python对象,如整数,浮点数和List,都有其独立的私有内存池,对象间不共享他们的内存池。也就是说如果你分配又释放了大量的整数,用于缓存这些整数的内存就不能再分配给浮点数。
——游响云停