利用python分析access日志的方法-编程学习网

前言

WAF上线之后，处理最多的是误报消除。

产生误报有多种原因，比如web应用源码编写时允许客户端提交过多的cookie；比如单个参数提交的数值太大。

把误报降低到了可接受的范围后，还要关注漏报。WAF不是神，任何WAF都可能被绕过。所以还需要定位漏过的攻击，明确漏报的原因，才能update WAF的策略。

要定位漏报，就必须分析Web应用的访问日志了。一个站点，每天产生的access日志大概接近1GB，显然靠肉眼看是不现实的。这就需要用python帮助自动分析。

实现思路

拿我司某Web系统举例：

apache开启了access日志记录

日志规则是每小时生成一个日志文件，以站点名称为文件名，以日期+时间为后缀。例如：special.XXXXXX.com.cn.2016101001

要分析这些散碎的日志文件，我的思路如下：

1、根据用户命令行输入获取日志文件所在目录；

2、遍历目录下所有文件，合并到一个文件；

3、定义web攻击常见payload的字符串：

SQLi的：select、union、+?+；

Struts的：ognl、java

webshell常见的：base64、eval、excute

使用正则逐行匹配，将命中的日志复制到单独的文件。

实现代码

代码如下：


# -*-coding: utf-8 -*-
import os,re,sys
if len(sys.argv) != 2 :
  print 'Usage : python logaudit.py <path>'
  sys.exit()
logpath = sys.argv[1]
#获取输入参数的文件路径'
merge = re.compile(r'.*(d[10])')
for root , dirs , files in os.walk(logpath):
  for line in files:
    #遍历日志文件夹，合并所有内容到一个文件
    pipei = merge.match(line)
    if pipei != None:
      tmppath = root + '\' +line
      logread1 = open(tmppath,'r')
      logread = logread1.read()
      log2txt = open('.\log.txt','a')
      log2txt.write(logread)
      log2txt.close()
      logread1.close()
    else:
      exit
log = open('.//log.txt','r')
logread = log.readlines()
auditString = re.compile(r'.*[^_][sS][eE][lL][eE][cC][tT][^.].*|.*[uU][nN][iI][Oo][nN].*|.*[bB][aA][sS][eE][^.].*|.*[oO][gG][nN][lL].*|.*[eE][vV][aA][lL][(].*|.*[eE][xX][cC][uU][tT][eE].*')
writelog = open('.//result.txt','a')
for lines in logread:
  auditResult = auditString.match(lines)
  if auditResult != None:
    writelog.write(auditResult.group())
    writelog.write('n')
  else:
    exit
writelog.close()
log.close()

总结

以上就是这篇文章的全部内容了，希望本文的内容对大家的学习或者工作能带来一定的帮助，如果有疑问大家可以留言交流。

文章详情

利用python分析access日志的方法

软考中级精品资料免费领

相关文章

猜你喜欢

利用python分析access日志的方法

使用goaccess分析nginx日志的详细方法

Python 关于日志的分析

利用Python中的pandas库对cdn日志进行分析详解

python分析nginx日志的ip（来

Linux中的日志分析利器：ail grep awk

Elasticsearch分布式搜索引擎在日志分析中的应用（如何利用Elasticsearch实现分布式日志分析？）

利用Python上传日志并监控告警的方法详解

python分析nginx日志的ip,url,status

python分析nginx日志的ip（来源）

Python记录日志的方法

如何利用 PHP 实现大数据日志分析？

如何利用 PHP 和 JavaScript 实现高效的日志分析？

python正则分析nginx的访问日志

python 3.x 分析日志的模块（正

MySQL慢日志查询分析方法与工具

利用shell命令统计日志的方法详解

java常见log日志的使用方法解析

MySQL慢查询日志的启用方法并实现Linux上分析

Apache日志分割的3种方法