3.1 编码解码
3.2 文件操作
encode编码
docode解码
python2 默认 ASCII格式
# -*- coding:utf-8 -*- # 声明程序是啥编码格式
# 将文本解码unicode格式
sname = name.decode("utf-8")# 必须先声明解码的格式是啥,比如utf-8
print(sname)
ssname = sname.encode("gbk")# 将文本编码成gbk格式
print(ssname)
# 必须注意的是: 当gbk转成utf-8时必须先转成unicode格式然后再转成uft-8 反过来也是
python3 默认 unicode
b = byte = 字节类型 = 2进制
py3 与py2 编码区别
encode 在编码的同时,会把数据转成bytes类型
decode 在解码的同时,会把bytes类型转成字符串
能调用方法的一定是对象
文件操作 , 下列方法都用在文件操作对象
r:读模式操作
w:写操作对象
a:追加添加
r+: 读写模式当使用write时文本会追加到最后一行的行尾
w+: 写读模式当使用write时,会先清空文件内容再写到文件中
a+: 追加读
open(1)# 打开,1表示一个汉字只打印一个字符
close# 关闭文件
write# 写模式
ra = open('测试文件','w',encoding='utf-8')
ra.write("就是第一行测试字符串.")
print(ra)
ra.close()
打印结果: <_io.TextIOWrapper name='测试文件' mode='w' encoding='utf-8'>
ra = open('测试文件','r',encoding='utf-8')
rar = ra.read()
print(rar)
ra.close()
打印结果:就是第一行测试字符串.
raa = open('测试文件','a',encoding='utf-8')
raa.write('就是第二行测试字符串')
raa.close()
打本文本结果: 就是第一行测试字符串.就是第二行测试字符串 默认没有换行,默认插入就是在光标处
raa = open('测试文件','a',encoding='utf-8')
raas = raa.write('\n就是第二行测试字符串\n')
raa.close()
与上一个不同的是,加上换行符之后它会换行
文件操作流程:
1、打开文件,得到文件句柄并赋值给一个变量;
句柄: 文件的操作对象
2、通过句柄对文件进行操作;
3、关闭文件
readline() 打印行 默认第一行
readlines() 打印全部行
# 打开一个测试文件以只读的方式,格式为utf-8
file = open('测试文件','r',encoding='utf-8')
# 赋值一个文件变量
a = file.readlines()
# 设置一个初始值
nubmer=0
# 循环打印a文件变量的值,从第一个开始
for i in a:
# 初始值每次加1当等于2的时候使用join给这行更改配置项,并不打印/n换行符
nubmer+=1
if nubmer == 2:
i = ''.join([i.strip(),'aaaaa'])
# 每次打印这行,当第2次等于join那么就输出第2次变量的值
print(i.strip())
# 关闭文件操作属性,
a.close()
修改文件
# 定义两个变量以及文件
f_read = open('测试文件','r',encoding='utf-8')
f_write = open('测试文件2','w',encoding='utf-8')
number = 0# 设置变量为0循环某文件行数时,每次加1
for f in f_read:
number += 1
if number == 2:# 当为2时,给文件变量字符串赋值一个
f='xiong test.\n'
f_write.write(f)# 最后给它写到新的一个文件里,就能完成修改文件操作
# 管理单个对象,此方法不再需要使用close()方法
with open('测试文件','r',encoding='utf-8') as f1:
pass
# 管理多个对象
with open('测试文件','r',encoding='utf-8') as f1,open('测试文件2','w',encoding='utf-8') as f2 :
pass
tell 检测光标位置
print(file.read(4))
print(file.tell())
打印结果:就是第一
12一个中文3个字符,uft8格式
文件对象.seek() 调整光标位置
print(file.seek(1))
print(file.tell())
打印结果:1
1
# 一个类型tail -1的脚本
f=open('file3','rb')
for i in f:
num_bytes=-10
while True:
data=f.readlines()
if len(data) > 1:
print('最后一行的结果是:%s'%(data[-1].decode('utf-8')))
break
num_bytes*=2