1.如何将item 数据model保存到数据库中
- 首先在本地创建好MySQL数据库,再数据库中创建好数据表
# 创建数据库create database item_database;set global validate_password_length = 1;set global validate_password_policy = 0;grant all on item_database.* to 'xkd'@'%' identified by '123456';flush privileges;# 根据item创建数据表create table item (title varchar(255) not null, image_url varchar(255) not null, date date not null, image_path varchar(255) not null, url varchar(255) not null, url_id char(50) not null primary key);
2. 安装Python MySQL驱动
pip install mysqlclient
3. 在settings文件中修改pipeline
- 然后爬取页面,进行页面解析,返回item交由settings.py文件中定义好的pipelines处理
ITEM_PIPELINES = { # 'XKD_Dribbble_Spider.pipelines.XkdDribbbleSpiderPipeline': 300, # 当items.py模块yield之后,默认就是下载image_url的页面 'XKD_Dribbble_Spider.pipelines.ImagePipeline': 1, 'XKD_Dribbble_Spider.pipelines.MysqlPipeline': 2,}
4. 新建pipeline,写入item到MySQL中
- 接着在pipelines.py文件中新建一个新的pipelines类,如MysqlPipeline,在这个类中初始化数据库连接,重写
process_item()
方法将item的字段读取出来,再提交到数据中表中; 最后运行项目成功后,可以使用命令行工具查看数据是否插入成功;
class MysqlPipeline: def __init__(self): self.conn = MySQLdb.connect(host='localhost', user='xkd', password='123456', database='item_database', use_unicode=True, charset='utf8') self.cursor = self.conn.cursor() def process_item(self, item, spider): sql = 'insert into item(title, image_url, date, image_path, url, url_id)' \ 'values (%s, %s, %s, %s, %s, %s)' date = item['date'] self.cursor.execute(sql, args=(item['title'], item['image_url'], date.strftime('%y-%m-%d'), item['image_path'], item['url'], item['url_id'])) self.conn.commit() return item def spider_closed(self, spider): self.cursor.close() self.conn.close()
5.在本地搭建MySQL数据库的步骤
先创建数据库:
create database 数据库名;
然后给用户授权:
grant all on 数据库名.* to '用户名'@'%' identified by '密码';
记得刷新MySQL的系统权限相关表:
flush privileges;
在进入创建好的数据库根据item创建数据库表:
create table item(字段);
6.查看数据库表
首先登录MySQL数据库,命令行:
mysql -u用户名 -p密码;
然后选择我们创建的数据库,命令行:
use 数据库名;
然后就可以查看数据库表是否成功插入数据,命令行:
select * from item;
;当数据库表中数据很多的时候,我们可以在查询语句末尾加入一个
\G
参数,横向的表结构会转为使用纵向表结构输出,利于阅读;
参考:https://www.9xkd.com/user/plan-view.html?id=1693196261
免责声明:
① 本站未注明“稿件来源”的信息均来自网络整理。其文字、图片和音视频稿件的所属权归原作者所有。本站收集整理出于非商业性的教育和科研之目的,并不意味着本站赞同其观点或证实其内容的真实性。仅作为临时的测试数据,供内部测试之用。本站并未授权任何人以任何方式主动获取本站任何信息。
② 本站未注明“稿件来源”的临时测试数据将在测试完成后最终做删除处理。有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341
软考中级精品资料免费领
- 历年真题答案解析
- 备考技巧名师总结
- 高频考点精准押题
- 资料下载
- 历年真题
193.9 KB下载数265
191.63 KB下载数245
143.91 KB下载数1148
183.71 KB下载数642
644.84 KB下载数2756
相关文章
发现更多好内容猜你喜欢
AI推送时光机item 数据model保存到数据库中
后端开发2023-06-02
Android保存数据到系统数据库中:Settings.System
后端开发2022-06-06
python怎么爬取数据保存到数据库
后端开发2023-09-08
C#中把FastReport.Net报表控件的数据保存到数据库
后端开发2024-04-02
Python爬虫如何获取数据并保存到数据库中
后端开发2023-07-02
Mybatis如何从数据库中获取数据存为List类型(存为model)
后端开发2024-04-02
C#中如何把FastReport.Net报表控件的数据保存到数据库
后端开发2023-07-02
将爬取的数据保存到mysql中
后端开发2023-01-30
navicat怎么保存数据库
后端开发2024-04-24
sql怎么保存数据库
后端开发2024-05-30
mysql数据库保存路径
后端开发2024-08-01
sqlserver如何保存数据库
后端开发2024-04-22
java如何保存数据到redis
后端开发2024-04-02
R语言怎么将数据存储到数据库中
后端开发2024-04-08
PHP实现将Word文件保存到SQLServer数据库
后端开发2024-04-02
php如何上传图片并保存到数据库
后端开发2023-10-11
oracle数据库日志会保存多久的数据
后端开发2024-05-11
咦!没有更多了?去看看其它编程学习网 内容吧