一、简介
Pickle模块实现了基本的数据序列化与反序列化操作。通过序列化操作,我们可以将程序中运行的对象信息转化为字节流保存到文件中去,永久存储在磁盘上。通过反序列化操作,我们可以将文件中字节流数据重新解析为一个python对象。
注:pickle序列化后的字节流数据可读性差,人一般无法识别。
1.1 为什么要对数据进行序列化操作?
1.不需要在跑代码时重新去计算得到数据,事先进行序列化操作保存数据可以节省计算机资源;
2.pkl文件能够更好的被内存调用,不需要经过数据格式的转换,因此提高了效率;而假如保存为其他格式(如txt、csv文件),那么数据读写速度都不如序列化后的数据。
3.Pickle可以保存多个对象。实验中,同一数据集下需要保存的内容不止一种,通过pickle可以全部将其保存到一个.pkl文件。
二、pickle.dump(obj, file, protocol)
obj: 要进行序列化的对象,这里将对象obj保存到文件file中去;
file: file表示保存到的类文件对象,file必须有write()接口,file可以是一个以’w’打开的文件或者是一个StringIO对象,也可以是任何可以实现write()接口的对象;
protocol: 序列化模式,默认是 0(ASCII协议,表示以文本的形式进行序列化),protocol的值还可以是1和2(1和2表示以二进制的形式进行序列化。其中,1是老式的二进制协议;2是新二进制协议)
import pickle
# 创建一个字典对象
data = {'a':[1,2,3],'b':'Hello'}
# 以二进制写入方式打开文件,得到文件对象
fw = open('./Mydata.pkl','wb')
# 将字典数据存储为一个pkl文件
pickle.dump(data, fw)
# 关闭文件
pickle.close()
序列化后的数据形式:
三、pickle.load(file)
file: 表示上一步序列化之后的文件,这里进行反序列化操作。
import pickle
# 以二进制读入方式打开文件,得到文件对象
fw = open(r'C:\python数据分析\python基础\testdata.pkl','rb')
# 将字节流数据反序列化为一个字典对象
data = pickle.load(pic2)
print(data)
打印出来的数据:
到此这篇关于Pickle模块中的dump()和load()方法介绍的文章就介绍到这了,更多相关Pickle模块dump()和load()方法内容请搜索编程网以前的文章或继续浏览下面的相关文章希望大家以后多多支持编程网!