文章详情

短信预约-IT技能 免费直播动态提醒

请输入下面的图形验证码

提交验证

短信预约提醒成功

Python如何读取配置文件ConfigParser的二次封装

2023-06-29 03:34

关注

今天小编给大家分享一下Python如何读取配置文件ConfigParser的二次封装的相关知识点,内容详细,逻辑清晰,相信大部分人都还太了解这方面的知识,所以分享这篇文章给大家参考一下,希望大家阅读完这篇文章后有所收获,下面我们一起来了解一下吧。

Python读取配置文件-ConfigParser二次封装

直接上上代码

test.conf

[database]connect = mysqlsleep = notest = yes

config.py

# -*- coding:utf-8 -*-__author__ = 'guoqianqian'import osimport ConfigParserimport oscurrent_dir = os.path.abspath(os.path.dirname(__file__))class OperationalError(Exception):    """operation error."""class Dictionary(dict):    """ custom dict."""    def __getattr__(self, key):        return self.get(key, None)    __setattr__ = dict.__setitem__    __delattr__ = dict.__delitem__class Config:    def __init__(self, file_name="test", cfg=None):        """        @param file_name: file name without extension.        @param cfg: configuration file path.        """        env = {}        for key, value in os.environ.items():            if key.startswith("TEST_"):                env[key] = value        config = ConfigParser.ConfigParser(env)        if cfg:            config.read(cfg)        else:            config.read(os.path.join(current_dir, "conf", "%s.conf" % file_name))        for section in config.sections():            setattr(self, section, Dictionary())            for name, raw_value in config.items(section):                try:                    # Ugly fix to avoid '0' and '1' to be parsed as a                    # boolean value.                    # We raise an exception to goto fail^w parse it                    # as integer.                    if config.get(section, name) in ["0", "1"]:                        raise ValueError                    value = config.getboolean(section, name)                except ValueError:                    try:                        value = config.getint(section, name)                    except ValueError:                        value = config.get(section, name)                setattr(getattr(self, section), name, value)    def get(self, section):        """Get option.        @param section: section to fetch.        @return: option value.        """        try:            return getattr(self, section)        except AttributeError as e:            raise OperationalError("Option %s is not found in "                                         "configuration, error: %s" %                                         (section, e))if __name__ == "__main__":    conf = Config()    print conf.get("database").connect    print conf.get("database").sleep    print conf.get("database").test

执行结果

mysql
False
True

目录结构

demo    conf        test.conf    config.py

读取配置文件&&简单封装

之前有做过把爬虫数据写到数据库中的练习,这次想把数据库信息抽离到一个ini配置文件中,这样做的好处在于可以在配置文件中添加多个数据库,方便切换(另外配置文件也可以添加诸如邮箱、url等信息)

1.configparser模块

python使用自带的configparser模块用来读取配置文件,配置文件的形式类似windows中的ini文件

在使用前需要先安装该模块,使用pip安装即可

2.configparser读取文件的基本方法

(1)新建一个config.ini文件,如下

Python如何读取配置文件ConfigParser的二次封装

(2)新建一个readconfig.py文件,读取配置文件的信息

import configparsercf = configparser.ConfigParser()cf.read("E:\Crawler\config.ini")  # 读取配置文件,如果写文件的绝对路径,就可以不用os模块secs = cf.sections()  # 获取文件中所有的section(一个配置文件中可以有多个配置,如数据库相关的配置,邮箱相关的配置,                        每个section由[]包裹,即[section]),并以列表的形式返回print(secs)options = cf.options("Mysql-Database")  # 获取某个section名为Mysql-Database所对应的键print(options)items = cf.items("Mysql-Database")  # 获取section名为Mysql-Database所对应的全部键值对print(items)host = cf.get("Mysql-Database", "host")  # 获取[Mysql-Database]中host对应的值print(host)

上述代码运行结果如下,可以和config.ini进行对比

Python如何读取配置文件ConfigParser的二次封装

3.引入os模块,使用相对目录读取配置文件

工程目录如下:

Python如何读取配置文件ConfigParser的二次封装

readconfig.py:

import configparserimport osroot_dir = os.path.dirname(os.path.abspath('.'))  # 获取当前文件所在目录的上一级目录,即项目所在目录E:\Crawlercf = configparser.ConfigParser()cf.read(root_dir+"/config.ini")  # 拼接得到config.ini文件的路径,直接使用secs = cf.sections()  # 获取文件中所有的section(一个配置文件中可以有多个配置,如数据库相关的配置,邮箱相关的配置,每个section由[]包裹,即[section]),并以列表的形式返回print(secs)options = cf.options("Mysql-Database")  # 获取某个section名为Mysql-Database所对应的键print(options)items = cf.items("Mysql-Database")  # 获取section名为Mysql-Database所对应的全部键值对print(items)host = cf.get("Mysql-Database", "host")  # 获取[Mysql-Database]中host对应的值print(host)

或者使用os.path.join()进行拼接

import configparserimport osroot_dir = os.path.dirname(os.path.abspath('.'))  # 获取当前文件所在目录的上一级目录,即项目所在目录E:\Crawlerconfigpath = os.path.join(root_dir, "config.ini")cf = configparser.ConfigParser()cf.read(configpath)  # 读取配置文件secs = cf.sections()  # 获取文件中所有的section(一个配置文件中可以有多个配置,如数据库相关的配置,邮箱相关的配置,每个section由[]包裹,即[section]),并以列表的形式返回print(secs)options = cf.options("Mysql-Database")  # 获取某个section名为Mysql-Database所对应的键print(options)items = cf.items("Mysql-Database")  # 获取section名为Mysql-Database所对应的全部键值对print(items)host = cf.get("Mysql-Database", "host")  # 获取[Mysql-Database]中host对应的值print(host)

4.通过读取配置文件

重新写一下之前的requests+正则表达式爬取猫眼电影的例子

把读取配置文件readconfig.py和操作数据库handleDB.py分别封装到一个类中

readconfig.py如下

import configparserimport osclass ReadConfig:    """定义一个读取配置文件的类"""    def __init__(self, filepath=None):        if filepath:            configpath = filepath        else:            root_dir = os.path.dirname(os.path.abspath('.'))            configpath = os.path.join(root_dir, "config.ini")        self.cf = configparser.ConfigParser()        self.cf.read(configpath)    def get_db(self, param):        value = self.cf.get("Mysql-Database", param)        return valueif __name__ == '__main__':    test = ReadConfig()    t = test.get_db("host")    print(t)

handleDB.py如下

# coding: utf-8# author: hmkfrom common.readconfig import ReadConfigimport pymysql.cursorsclass HandleMysql:    def __init__(self):        self.data = ReadConfig()    def conn_mysql(self):        """连接数据库"""        host = self.data.get_db("host")        user = self.data.get_db("user")        password = self.data.get_db("password")        db = self.data.get_db("db")        charset = self.data.get_db("charset")        self.conn = pymysql.connect(host=host, user=user, password=password, db=db, charset=charset)        self.cur = self.conn.cursor()    def execute_sql(self, sql, data):        """执行操作数据的相关sql"""        self.conn_mysql()        self.cur.execute(sql, data)        self.conn.commit()    def search(self, sql):        """执行查询sql"""        self.conn_mysql()        self.cur.execute(sql)        return self.cur.fetchall()    def close_mysql(self):        """关闭数据库连接"""        self.cur.close()        self.conn.close()if __name__ == '__main__':    test = HandleMysql()    sql = "select * from maoyan_movie"    for i in test.search(sql):        print(i)

最后的运行文件,调用前面的方法

# coding: utf-8# author: hmkimport requestsimport refrom common import handleDBclass Crawler:    """定义一个爬虫类"""    def __init__(self):        self.db = handleDB.HandleMysql()    @staticmethod    def get_html(url, header):        response = requests.get(url=url, headers=header)        if response.status_code == 200:            return response.text        else:            return None    @staticmethod    def get_data(html, list_data):        pattern = re.compile(r'<dd>.*?<i.*?>(\d+)</i>.*?'  # 匹配电影排名                             r'<p class="name"><a.*?data-val=".*?">(.*?)'  # 匹配电影名称                             r'</a>.*?<p.*?class="releasetime">(.*?)</p>'  # 匹配上映时间                             r'.*?<i.*?"integer">(.*?)</i>'  # 匹配分数的整数位                             r'.*?<i.*?"fraction">(.*?)</i>.*?</dd>', re.S)  # 匹配分数小数位        m = pattern.findall(html)        for i in m:  # 因为匹配到的所有结果会以列表形式返回,每部电影信息以元组形式保存,所以可以迭代处理每组电影信息            ranking = i[0]  # 提取一组电影信息中的排名            movie = i[1]  # 提取一组电影信息中的名称            release_time = i[2]  # 提取一组电影信息中的上映时间            score = i[3] + i[4]  # 提取一组电影信息中的分数,这里把分数的整数部分和小数部分拼在一起            list_data.append([ranking, movie, release_time, score])  # 每提取一组电影信息就放到一个列表中,同时追加到一个大列表里,这样最后得到的大列表就包含所有电影信息    def write_data(self, sql, data):        self.db.conn_mysql()        try:            self.db.execute_sql(sql, data)            print('导入成功')        except:            print('导入失败')        self.db.close_mysql()    def run_main(self):        start_url = 'http://maoyan.com/board/4'        depth = 10  # 爬取深度(翻页)        header = {"Accept": "text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,*/*;q=0.8",                  "Accept-Encoding": "gzip, deflate, sdch",                  "Accept-Language": "zh-CN,zh;q=0.8",                  "Cache-Control": "max-age=0",                  "Connection": "keep-alive",                  "Host": "maoyan.com",                  "Referer": "http://maoyan.com/board",                  "Upgrade-Insecure-Requests": "1",                  "User-Agent": "Mozilla/5.0 (Windows NT 6.1; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/49.0.2623.75 Safari/537.36"}        for i in range(depth):            url = start_url + '?offset=' + str(10 * i)            html = self.get_html(url, header)            list_data = []            self.get_data(html, list_data)            for i in list_data:                """这里的list_data参数是指正则匹配并处理后的列表数据(是一个大列表,包含所有电影信息,每个电影信息都存在各自的一个列表中;                对大列表进行迭代,提取每组电影信息,这样提取到的每组电影信息都是一个小列表,然后就可以把每组电影信息写入数据库了)"""                movie = i  # 每组电影信息,这里可以看做是准备插入数据库的每组电影数据                sql = "insert into maoyan_movie(ranking,movie,release_time,score) values(%s, %s, %s, %s)"  # sql插入语句                self.write_data(sql, movie)if __name__ == '__main__':    test = Crawler()    test.run_main()

以上就是“Python如何读取配置文件ConfigParser的二次封装”这篇文章的所有内容,感谢各位的阅读!相信大家阅读完这篇文章都有很大的收获,小编每天都会为大家更新不同的知识,如果还想学习更多的知识,请关注编程网行业资讯频道。

阅读原文内容投诉

免责声明:

① 本站未注明“稿件来源”的信息均来自网络整理。其文字、图片和音视频稿件的所属权归原作者所有。本站收集整理出于非商业性的教育和科研之目的,并不意味着本站赞同其观点或证实其内容的真实性。仅作为临时的测试数据,供内部测试之用。本站并未授权任何人以任何方式主动获取本站任何信息。

② 本站未注明“稿件来源”的临时测试数据将在测试完成后最终做删除处理。有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

软考中级精品资料免费领

  • 历年真题答案解析
  • 备考技巧名师总结
  • 高频考点精准押题
  • 2024年上半年信息系统项目管理师第二批次真题及答案解析(完整版)

    难度     807人已做
    查看
  • 【考后总结】2024年5月26日信息系统项目管理师第2批次考情分析

    难度     351人已做
    查看
  • 【考后总结】2024年5月25日信息系统项目管理师第1批次考情分析

    难度     314人已做
    查看
  • 2024年上半年软考高项第一、二批次真题考点汇总(完整版)

    难度     433人已做
    查看
  • 2024年上半年系统架构设计师考试综合知识真题

    难度     221人已做
    查看

相关文章

发现更多好内容

猜你喜欢

AI推送时光机
位置:首页-资讯-后端开发
咦!没有更多了?去看看其它编程学习网 内容吧
首页课程
资料下载
问答资讯