IO:Input/Output
由于CPU和内存的速度远远高于外设的速度,所以,在IO编程中,就存在速度严重不匹配的问题。举个例子来说,比如要把100M的数据写入磁盘,CPU输出100M的数据只需要0.01秒,可是磁盘要接收这100M数据可能需要10秒,怎么办呢?有两种办法:
第一种是CPU等着,也就是程序暂停执行后续代码,等100M的数据在10秒后写入磁盘,再接着往下执行,这种模式称为同步IO;
另一种方法是CPU不等待,只是告诉磁盘,“您老慢慢写,不着急,我接着干别的事去了”,于是,后续代码可以立刻接着执行,这种模式称为异步IO。
同步和异步的区别就在于是否等待IO执行的结果。
好比你去麦当劳点餐,你说“来个汉堡”,服务员告诉你,对不起,汉堡要现做,需要等5分钟,于是你站在收银台前面等了5分钟,拿到汉堡再去逛商场,这是同步IO。
你说“来个汉堡”,服务员告诉你,汉堡需要等5分钟,你可以先去逛商场,等做好了,我们再通知你,这样你可以立刻去干别的事情(逛商场),这是异步IO。
很明显,使用异步IO来编写程序性能会远远高于同步IO,但是异步IO的缺点是编程模型复杂。
想想看,你得知道什么时候通知你“汉堡做好了”,而通知你的方法也各不相同。如果是服务员跑过来找到你,这是回调模式,如果服务员发短信通知你,你就得不停地检查手机,这是轮询模式。总之,异步IO的复杂度远远高于同步IO。
读文件
1、读写一个文件之前需要打开它:
fileobj = open(filename, mode)
mode :文件类型和操作的字符串。
mode 的第一个字母表明对其的操作:
• r 表示读模式。
• w 表示写模式。如果文件不存在则新创建,如果存在则重写新内容。
• x 表示在文件不存在的情况下新创建并写文件。
• a 表示如果文件存在,在文件末尾追加写内容。
mode 的第二个字母是文件类型:
• t(或者省略)代表文本类型;
• b 代表二进制文件
f = open('/Users/michael/test.txt', 'r')
#要读取二进制文件,比如图片、视频等等,用'rb'模式打开文件即可:
f = open('/Users/michael/test.jpg', 'rb')
#读取非UTF-8编码的文本文件,要给open()函数传入encoding参数,例如,读取GBK编码的文件:
f = open('/Users/michael/gbk.txt', 'r', encoding='gbk')
2、如果文件打开成功,调用read()方法可以一次读取文件的全部内容,Python把内容读到内存,用一个str对象表示:
>>> f.read()
'Hello, world!'
3、调用close()方法关闭文件。文件使用完毕后必须关闭,因为文件对象会占用操作系统的资源,并且操作系统同一时间能打开的文件数量也是有限的:
>>> f.close()
4、由于文件读写时都有可能产生IOError,一旦出错,后面的f.close()就不会调用。所以,为了保证无论是否出错都能正确地关闭文件,我们可以使用try … finally来实现:
try:
#读取文本文件,并且是UTF-8编码的文本文件
f = open('/path/to/file', 'r')
print(f.read())
finally:
if f:
f.close()
但是每次都这么写实在太繁琐,所以,Python引入了with语句来自动帮我们调用close()方法:
with open('/path/to/file', 'r') as f:
print(f.read())
两者等同,这种更保险,更简洁。
写文件
调用open()函数时,传入标识符’w’或者’wb’表示写文本文件或写二进制文件:
f = open('/Users/michael/test.txt', 'w')
f.write('Hello, world!')
f.close()
可以反复调用write()来写入文件,但是务必要调用f.close()来关闭文件。当我们写文件时,操作系统往往不会立刻把数据写入磁盘,而是放到内存缓存起来,空闲的时候再慢慢写入。只有调用close()方法时,操作系统才保证把没有写入的数据全部写入磁盘。忘记调用close()的后果是数据可能只写了一部分到磁盘,剩下的丢失了。所以,还是用with语句来得保险:
with open('/Users/michael/test.txt', 'w') as f:
f.write('Hello, world!')
要写入特定编码的文本文件,请给open()函数传入encoding参数,将字符串自动转换成指定编码。
注:使用with语句操作文件IO是个好习惯。
StringIO和BytesIO
是在内存中操作str和bytes的方法,使得和读写文件具有一致的接口。
StringIO:在内存中读写str,操作的只能是str。
如果要操作二进制数据,就需要使用BytesIO。
1、要把str写入StringIO或者二进制数据写入BytesIO,我们需要先创建一个StringIO或者BytesIO,然后像文件一样写入即可:
from io import StringIO
f=StringIO()
f.write('hello')
f.write(' ')
f.write('world!')
#getvalue()方法用于获得写入后的str。
print(f.getvalue())
结果:hello world!
from io import BytesIO
f=BytesIO()
f.write('中文'.encode('utf-8'))
#请注意,写入的不是str,而是经过UTF-8编码的bytes。
print(f.getvalue())
结果:b’\xe4\xb8\xad\xe6\x96\x87’
2、读取StringIO或者BytesIO,可以用一个str初始化StringIO或者用一个bytes初始化BytesIO,然后像读文件一样读取:
from io import StringIO
f=StringIO('Hello!\nHi!\nGoodbye!')
while True:
s=f.readline()
if s== '':
break
print(s.strip()) # 把末尾的'\n'删掉
结果:
Hello!
Hi!
Goodbye!
from io import BytesIO
f=BytesIO(b'\xe4\xb8\xad\xe6\x96\x87')
f.read()
print(f.getvalue())
结果:b’\xe4\xb8\xad\xe6\x96\x87’