文章详情

短信预约-IT技能 免费直播动态提醒

请输入下面的图形验证码

提交验证

短信预约提醒成功

使用异步的twisted框架写入数据

2023-06-02 05:32

关注

1.twisted框架介绍

  • Twisted是用Python实现的基于事件驱动的网络引擎框架;

  • Twisted支持许多常见的传输及应用层协议,包括TCP、UDP、SSL/TLS、HTTP、IMAP、SSH、IRC以及FTP。就像Python一样,Twisted也具有“内置池”(batteries-included)的特点。Twisted对于其支持的所有协议都带有客户端和服务器实现,同时附带有基于命令行的工具,使得配置和部署产品级的Twisted应用变得非常方便。

  • 官网地址:https://twistedmatrix.com/trac/

mysql-settings-">2.MySQL数据库信息保存到settings文件中

  • 首先我们需要把MySQL数据库中的配置信息保存到settings文件中,如:MYSQL_HOST = 'localhost'的形式;
MYSQL_HOST = 'localhost'MYSQL_USER = 'xkd'MYSQL_PASSWORD = '123456'MYSQL_DATABASE = 'item_database'MYSQL_PORT = 3306MYSQL_OPTIONAL = dict(    USE_UNICODE = True,    CHARSET = 'utf8',)
  • 然后从settings文件中将这些信息导入到pipeline.py文件中使用;
from .settings import MYSQL_HOST, MYSQL_USER, MYSQL_PASSWORD, MYSQL_DATABASE, MYSQL_PORT, MYSQL_OPTIONALclass MysqlPipeline:    def __init__(self):        self.conn = MySQLdb.connect(host=MYSQL_HOST, user=MYSQL_USER, password=MYSQL_PASSWORD, database=MYSQL_DATABASE, use_unicode=MYSQL_OPTIONAL.get('USE_UNICODE'), charset=MYSQL_OPTIONAL.get('CHARSET'))        self.cursor = self.conn.cursor()    def process_item(self, item, spider):        sql = 'insert into item(title, image_url, date, image_path, url, url_id)' \              'values (%s, %s, %s, %s, %s, %s)'        date = item['date']        self.cursor.execute(sql, args=(item['title'], item['image_url'], date, item['image_path'], item['url'], item['url_id']))        self.conn.commit()        return item    def spider_closed(self, spider):        self.cursor.close()        self.conn.close()

3.创建异步Pipeline写入数据库

  • 首先创建一个用于异步写入数据的AIOMysqlItemPipeline类,然后在这个类的初始化方法中创建一个pool连接池;

  • 然后在from_settings()方法中获取settings文件中的数据库配置信息,并将配置信息存入一个字典中。使用Twisted中的adbapi获取数据库连接池对象,使用前需要导入adbapi,如:from twisted.enterprise import adbapi。使用时需要用到ConnectionPool连接池:pool=adbapi.ConnectionPool('MySQLdb',**params),参数MySQLdb是使用的数据库引擎的名字,params就是要传递的数据库配置信息;

  • 接着在process_item()方法中使用数据库连接池对象进行数据库操作,自动传递cursor对象到数据库操作方法runInteraction()的第一个参数(自定义方法)如:ret=self.connection_pool.runInteraction(self.mysql_insert,item)

  • 还可以设置出错时的回调方法,自动传递出错消息对象failure到错误处理方法的第一个参数(自定义方法)如:ret.addErrback(self.error_callback)

  • 最后记得修改settings文件中的ITEM_PIPELINES配置,如:'XKD_Dribbble_Spider.pipelines.AIOMysqlItemPipeline': 2

from twisted.enterprise import adbapiimport MySQLdb.cursorsclass AIOMysqlItemPipeline:    def __init__(self, pool):        self.connection_pool = pool    # 1:调用类方法    @classmethod    def from_settings(cls, settings):        connkw = {            'host': MYSQL_HOST,            'user': MYSQL_USER,            'password': MYSQL_PASSWORD,            'db': MYSQL_DATABASE,            'port': MYSQL_PORT,            'use_unicode': MYSQL_OPTIONAL.get('USE_UNICODE'),            'charset': MYSQL_OPTIONAL.get('CHARSET'),            'cursorclass': MySQLdb.cursors.DictCursor,        }        pool = adbapi.ConnectionPool('MySQLdb', **connkw)        return cls(pool)    # 2:执行process_item    def process_item(self, item, spider):        ret = self.connection_pool.runInteraction(self.mysql_insert, item)        ret.addErrback(self.error_callback)    def mysql_insert(self, cursor, item):        sql = 'insert into item(title, image_url, date, image_path, url, url_id)' \              'values (%s, %s, %s, %s, %s, %s)'        date = item['date']        cursor.execute(sql, args=(item['title'], item['image_url'], date, item['image_path'], item['url'], item['url_id']))    def error_callback(self, error):        print('insert_error =========== {}'.format(error))修改settings文件ITEM_PIPELINES = {   # 'XKD_Dribbble_Spider.pipelines.XkdDribbbleSpiderPipeline': 300,   # 当items.py模块yield之后,默认就是下载image_url的页面   'XKD_Dribbble_Spider.pipelines.ImagePipeline': 1,   'XKD_Dribbble_Spider.pipelines.AIOMysqlItemPipeline': 2,}

参考:https://www.9xkd.com/user/plan-view.html?id=1784587600

免责声明:

① 本站未注明“稿件来源”的信息均来自网络整理。其文字、图片和音视频稿件的所属权归原作者所有。本站收集整理出于非商业性的教育和科研之目的,并不意味着本站赞同其观点或证实其内容的真实性。仅作为临时的测试数据,供内部测试之用。本站并未授权任何人以任何方式主动获取本站任何信息。

② 本站未注明“稿件来源”的临时测试数据将在测试完成后最终做删除处理。有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

软考中级精品资料免费领

  • 历年真题答案解析
  • 备考技巧名师总结
  • 高频考点精准押题
  • 资料下载
  • 历年真题
  • 2024年上半年信息系统项目管理师第二批次真题及答案解析(完整版)

    难度     813人已做
    查看
  • 【考后总结】2024年5月26日信息系统项目管理师第2批次考情分析

    难度     354人已做
    查看
  • 【考后总结】2024年5月25日信息系统项目管理师第1批次考情分析

    难度     318人已做
    查看
  • 2024年上半年软考高项第一、二批次真题考点汇总(完整版)

    难度     435人已做
    查看
  • 2024年上半年系统架构设计师考试综合知识真题

    难度     224人已做
    查看

相关文章

发现更多好内容

猜你喜欢

AI推送时光机
咦!没有更多了?去看看其它编程学习网 内容吧
首页课程
资料下载
问答资讯