文章详情

短信预约-IT技能 免费直播动态提醒

请输入下面的图形验证码

提交验证

短信预约提醒成功

Python文件对比

2023-01-31 04:35

关注

环境:

python2.6.6

linux系统



对比文件差异用Python里的difflib模块:

Python自带difflib模块,无需安装。


对比两个文件是否一样总体思路就是:将文件里的内容读出来然后再对比


符号含义
+包含在第二个序列中,但不包含第一个序列中
-包含在第一个序列中,但不包含第二个序列中
标志两个序列行存在增量差异
^标志两个序列存在的差异字符
''两个序列行一致

示例一:

#!/usr/bin/python
#coding:utf-8
#2017,8,27

import difflib

text1='''1234567890
this is a text one.
heihiehie
'''
text1_line=text1.splitlines() #以行进行分割,以便以后对比

text2='''235678956545
This is a Text two.
heiheihei
'''
text2_line=text2.splitlines()

d = difflib.Differ() #创建Differ()对象

diff = d .compare(text1_line,text2_line)

print '\n'.join(list(diff))

看下运行结果:


wKioL1muneKQiZ-VAAAbFrbCiAk671.png


都是符号,符号不好分辨,接下来生成html文件。


示例二:

#!/usr/bin/python
#coding:utf-8
#2017,8,27


import difflib

text1='''1234567890
this is a text one.
heihiehie
'''

text1_line=text1.splitlines() #以行进行分割,以便以后对比

text2='''235678956545
This is a Text two.
heiheihei
'''

text2_line=text2.splitlines()
d = difflib.HtmlDiff() #创建Differ()对象
print d.make_file(text1_line,text2_line)

执行命令生成diff.html文件

[root@China difflib]# python diff_simple2.py >> diff.html

用浏览器打开diff.html文件:

wKioL1muoECAgp_5AAAZWMKBH6g864.png


这样是不是就好看多了。


综合应用,对比两个文件的差异:

#!/usr/bin/python
#-*-coding:utf-8-*-
#2017.9.5

import difflib
import sys

#接收参数
try:
	textfile1=sys.argv[1]
	textfile2=sys.argv[2]

except Exception,e:
	print "error:"+str(e)
	print "usage:python Contrast_file.py filename1 filename2 >> diff.html"
	sys.exit()

#读取文件函数

def  readfile(filename):
	try:
		fileHandle = open(filename, 'rb')
		text = fileHandle.read().splitlines()
		fileHandle.close()
		return text
	except IOError as error:
		print "read file error:"+str(error)
		sys.exit()

#判断接收的是否为空
if (textfile1 == "" or textfile2==""):
	print "usage:python Contrast_file.py filename1 filename2 >> diff.html" 
	sys.exit()
#调用函数获取分割后的字符串
text1_lines = readfile(textfile1)  
text2_lines = readfile(textfile2)

#创建html类对象,并且进行比较。
diff = difflib.HtmlDiff()
print diff.make_file(text1_lines,text2_lines)

执行命令生成diff2.html文件,用浏览器打开和示例二一样。

[root@China difflib]# python Contrast_file.py httpd.conf httpd.conf.bak >> diff2.html

参考资料:网络和Python自动化运维技术与最佳实践

总结:思路很重要,这次文件对比的思路就是先把文件读出来,在进行对比。每天进步一点点。



wKioL1muoZrC6lsKAAQF1aT1ixQ620.png

阅读原文内容投诉

免责声明:

① 本站未注明“稿件来源”的信息均来自网络整理。其文字、图片和音视频稿件的所属权归原作者所有。本站收集整理出于非商业性的教育和科研之目的,并不意味着本站赞同其观点或证实其内容的真实性。仅作为临时的测试数据,供内部测试之用。本站并未授权任何人以任何方式主动获取本站任何信息。

② 本站未注明“稿件来源”的临时测试数据将在测试完成后最终做删除处理。有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

软考中级精品资料免费领

  • 历年真题答案解析
  • 备考技巧名师总结
  • 高频考点精准押题
  • 2024年上半年信息系统项目管理师第二批次真题及答案解析(完整版)

    难度     813人已做
    查看
  • 【考后总结】2024年5月26日信息系统项目管理师第2批次考情分析

    难度     354人已做
    查看
  • 【考后总结】2024年5月25日信息系统项目管理师第1批次考情分析

    难度     318人已做
    查看
  • 2024年上半年软考高项第一、二批次真题考点汇总(完整版)

    难度     435人已做
    查看
  • 2024年上半年系统架构设计师考试综合知识真题

    难度     224人已做
    查看

相关文章

发现更多好内容

猜你喜欢

AI推送时光机
位置:首页-资讯-后端开发
咦!没有更多了?去看看其它编程学习网 内容吧
首页课程
资料下载
问答资讯