文章详情

短信预约-IT技能 免费直播动态提醒

请输入下面的图形验证码

提交验证

短信预约提醒成功

深入Python中的文件操作

2024-12-03 17:43

关注

 任何语言都离不开对文件的操作,那么Python语言是如何来操作和管理文件的。

编码方式

编码方式的历史大致为ASCII ->gb2312->unicode->utf-8,期间具体详细信息可以百度

来个编码解码的小例子先,记住中文可以进行GBK和utf-8编码,在GBk一个中文字符对应两个字节,在utf-8一个中文字符对应三个字节,中文不能进行ASCII编码。

  1. >>> '刘润森'.encode('GBK'
  2. b'\xc1\xf5\xc8\xf3\xc9\xad' 
  3. >>> '刘润森'.encode('ascii'
  4. Traceback (most recent call last): 
  5.   File "", line 1, in  
  6. UnicodeEncodeError: 'ascii' codec can't encode characters in position 0-2: ordinal not in range(128) 
  7. >>> 'Runsen'.encode('ascii'
  8. b'Runsen' 
  9. >>> "刘润森".encode('utf-8'
  10. b'\xe5\x88\x98\xe6\xb6\xa6\xe6\xa3\xae' 
  11. >>> '刘润森'.encode('GBK').decode('GBK'
  12. '刘润森' 
  13. >>> '刘润森'.encode('GBK').decode('utf-8'
  14. UnicodeDecodeError: 'utf-8' codec can't decode byte 0xc1 in position 0: invalid start byte 

如果编码解码格式不一致可能会出现乱码,encode表示编码,decode表示解码。

 

文件操作的API

下面是Python文件操作的具体的API。

打开文件

Python的open()函数打开一个文件时,有若干个参数可用。然而,最常用的参数只有前两个。

open(file, mode='r', buffering=-1, encoding=None, errors=None, newline=None, closefd=True, opener=None)注意,第一个是强制性的,其余的是可选的。如果不添加mode参数,文件将在Python中以只读模式打开。

 

encoding:可以不写。不写参数,默认的编码本是操作系统默认的编码本。windows默认gbk,linux默认utf-8,mac默认utf-8。

  1. f=open('test.txt',encoding='utf-8')   #打开文件 
  2. data=f.read()  #读取文件 
  3. print(data) 
  4. f.close() #关闭文件       

mode

读取文件

代码中用到的文件文件操作的1.txt 文件内容如下:

  1. 关注《Python之王》公众号 
  2. 作者:Runsen 

readline(),使用该方法时,需要指定打开文件的模式为r或者r+;

 

readlines(),读取全部行.返回一个列表,列表中的每个元素是原文件的每一行。如果文件很大,占内存,容易崩盘。

  1. # 打开文件进行读取 
  2. f = open("1.txt","r",encoding='utf-8'
  3. # 根据大小读取文件内容 
  4. print('输出来自 read() 方法\n',f.read(2048)) 
  5. # 关闭文件 
  6. f.close() 
  7. # 打开文件进行读写 
  8. f = open("1.txt","r+",encoding='utf-8'
  9. # 读取第2个字和第2行行的文件内容 
  10. print('输出来自 readline() 方法\n',f.readline(2)) 
  11. print('输出来自 readlines() 方法\n',f.readlines(2)) 
  12. # 关闭文件 
  13. f.close() 
  14. # 打开文件进行读取和附加 
  15. f = open("1.txt","r",encoding='utf-8'
  16. # 打开文件进行读取和附加 
  17. print('输出来自 readlines() 方法\n',f.readlines()) 
  18. # 关闭文件 
  19. f.close() 
  20.  
  21. # 输出如下 
  22. 输出来自 read() 方法 
  23.  关注《Python之王》公众号 
  24. 作者:Runsen 
  25. 输出来自 readline() 方法 
  26.  关注 
  27. 输出来自 readlines() 方法 
  28.  ['《Python之王》公众号\n'
  29. 输出来自 readlines() 方法 
  30.  ['关注《Python之王》公众号\n''作者:Runsen'

写入文件

下面只介绍清除写 w和追加写 a

案例:将关注《Python之王》公众号写入 test.txt 文件中

  1. # mode=w 没有文件就创建,有就清除内容,小心使用 
  2. with open('test.txt''w', encoding='utf-8'as fb: 
  3.       fb.write('关注《Python之王》公众号\n')   

下面再将作者:Runsen写入test.txt 文件中

  1. with open('test.txt''w', encoding='utf-8'as fb: 
  2.       fb.write('作者:Runsen\n')   

运行后会发现之前写的关注《Python之王》公众号内容修改为作者:Runsen,因为 w模式会清除原文件内容,所以小心使用。只要使用了w,就要一次性写完。

追加写 a

 

案例:将静夜思这首诗追加到 test.txt 文件中

  1. # mode=a 追加到文件的最后 
  2. with open('test.txt''a', encoding='utf-8'as fb: 
  3.       fb.write('关注《Python之王》公众号\n')   
  4. with open('test.txt''a'encoding='utf-8'as fb: 
  5.       fb.write('作者:Runsen\n')       

指针操作

事物或资源都是以文件的形式存在,比如消息、共享内存、连接等,句柄可以理解为指向这些文件的指针。

句柄(handle)是一个来自编译原理的术语,指的是一个句子中最先被规约的部分,所以带有一个「句」字。

句柄的作用就是定位,两个APi还是tell和seek。

tell返回文件对象在文件中的当前位置,seek将文件对象移动到指定的位置,传入的参数是offset ,表示移动的偏移量。

 

下面通过示例对上述函数作进一步了解,如下所示:

  1. with open('test.txt''rb+'as f: 
  2.     f.write(b'Runsen'
  3.     # 文件对象位置 
  4.     print(f.tell()) 
  5.     # 移动到文件的第四个字节 
  6.     f.seek(3) 
  7.     # 读取一个字节,文件对象向后移动一位 
  8.     print(f.read(1)) 
  9.     print(f.tell()) 
  10.     # whence 为可选参数,值为 0 表示从文件开头起算(默认值)、值为 1 表示使用当前文件位置、值为 2 表示使用文件末尾作为参考点 
  11.     # 移动到倒数第二个字节 
  12.     f.seek(-2, 2) 
  13.     print(f.tell()) 
  14.     print(f.read(1)) 
  15.      
  16. #输出如下 
  17. b's' 
  18. 50 

上下文管理

我们会进行这样的操作:打开文件,读写,关闭文件。程序员经常会忘记关闭文件。上下文管理器可以在不需要文件的时候,自动关闭文件,使用with open即可。

  1. with context manager 
  2. with open("new.txt""w"as f: 
  3.     print(f.closed) 
  4.     f.write("Hello World!"
  5. print(f.closed) 
  6.  
  7. #输出如下 
  8. False 
  9. True 

如何批量读取多个文件

下面,批量读取某文件夹下的txt文件

  1. file_list = ['1.txt''2.txt''3.txt','4.txt'
  2. for path in file_list: 
  3.     with open(path, encoding='utf-8'as f: 
  4.         for line in f: 
  5.             print(line) 

下面将批量读取文件夹下的txt文件的内容,合并内容到一个新文件5.txt中,具体实现的代码如下。

  1. import os 
  2. #获取目标文件夹的路径 
  3. filedir = os.getcwd()+'\\'+'\\txt' 
  4. #获取当前文件夹中的文件名称列表 
  5. filenames = [] 
  6. for i in os.listdir(filedir): 
  7.     if i.split(".")[-1] == 'txt'
  8.         filenames.append(i) 
  9. #打开当前目录下的5.txt文件,如果没有则创建 
  10. f = open('5.txt','w'
  11. #先遍历文件名 
  12. for filename in filenames: 
  13.     filepath = filedir+'\\'+filename 
  14.     #遍历单个文件,读取行数 
  15.     for line in open(filepath,encoding='utf-8'): 
  16.         f.writelines(line) 
  17.         f.write('\n'
  18. #关闭文件 
  19. f.close() 

其实在Window中只需要cd 至目标文件夹,即你需要将所有想要合并的txt文件添加至目标文件夹中,执行如下DOS命令 type *.txt > C:\目标路径\合并后的文件名.txt

练习

题目:创建文件data.txt,文件共100000行,每行存放一个1~100之间的整数,题目来源:牛客

  1. import random 
  2.  
  3. f = open(‘data.txt’,‘w+’) 
  4. for i in range(100000): 
  5.   f.write(str(random.randint(1,100)) + ‘\n’) 
  6.   f.seek(0) 
  7.   print(f.read()) 
  8.   f.close() 

题目:生成100个MAC地址并写入文件中,MAC地址前6位(16进制)为01-AF-3B,题目来源:牛客

  1. import random 
  2. import string 
  3.  
  4. def create_mac(): 
  5.   MAC='01-AF-3B' 
  6.   hex_num =string.hexdigits #0123456789abcdefABCDEF 
  7.   for i in range(3): 
  8.     n = random.sample(hex_num,2) 
  9.     sn = '-' + ''.join(n).upper() 
  10.     MAC += sn 
  11.   return MAC 
  12.  
  13. def main(): 
  14.   with open('mac.txt','w'as f: 
  15.     for i in range(100): 
  16.       mac = create_mac() 
  17.       print(mac) 
  18.       f.write(mac+'\n'
  19.  
  20. main() 

本文已收录 GitHub,传送门~[1] ,里面更有大厂面试完整考点,欢迎 Star。

来源:Python之王内容投诉

免责声明:

① 本站未注明“稿件来源”的信息均来自网络整理。其文字、图片和音视频稿件的所属权归原作者所有。本站收集整理出于非商业性的教育和科研之目的,并不意味着本站赞同其观点或证实其内容的真实性。仅作为临时的测试数据,供内部测试之用。本站并未授权任何人以任何方式主动获取本站任何信息。

② 本站未注明“稿件来源”的临时测试数据将在测试完成后最终做删除处理。有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

软考中级精品资料免费领

  • 历年真题答案解析
  • 备考技巧名师总结
  • 高频考点精准押题
  • 2024年上半年信息系统项目管理师第二批次真题及答案解析(完整版)

    难度     813人已做
    查看
  • 【考后总结】2024年5月26日信息系统项目管理师第2批次考情分析

    难度     354人已做
    查看
  • 【考后总结】2024年5月25日信息系统项目管理师第1批次考情分析

    难度     318人已做
    查看
  • 2024年上半年软考高项第一、二批次真题考点汇总(完整版)

    难度     435人已做
    查看
  • 2024年上半年系统架构设计师考试综合知识真题

    难度     224人已做
    查看

相关文章

发现更多好内容

猜你喜欢

AI推送时光机
位置:首页-资讯-后端开发
咦!没有更多了?去看看其它编程学习网 内容吧
首页课程
资料下载
问答资讯