文章详情

短信预约-IT技能 免费直播动态提醒

请输入下面的图形验证码

提交验证

短信预约提醒成功

一日一技:为什么 Scrapy 启动 A 爬虫,B 爬虫会自动启动?

2024-12-02 21:11

关注

昨天有位同学在公众号俱乐部群问了这样一个问题:

他在一个 Scrapy 项目里面,有两个爬虫 A 和 B,他使用命令scrapy crawl B想启动 B 爬虫,但是发现 A 爬虫也自动运行了。

然后,这个同学贴上来他的爬虫代码:

看到这个代码,我就知道是怎么回事了。要解释这个现象,我们需要掌握两个知识点:

Scrapy 是怎么加载爬虫的?

Python 的类变量与实例变量的区别。

Scrapy 是怎么加载爬虫的?

我们知道,Scrapy 的 spiders 文件夹里面,可以定义很多个爬虫文件。只要每个爬虫文件的 name 的值不一样,那么,我们就可以使用scrapy crawl name 的值来启动特定的爬虫。

那么,Scrapy 它是怎么根据这个名字找到对应的类的呢?

实际上,在我们执行scrapy crawl xxx的时候,Scrapy 有几个主要的步骤:

从这个过程我们可以知道,spiders 文件夹下面,每一个爬虫类都会被加载。

Python 的类属性和实例属性

在我们定义Python 类的时候,我们其实可以在类里面,所有方法的外面写代码,例如:

  1. class Test: 
  2.     a = 1 + 1 
  3.     b = 2 + 2 
  4.     if a + b == 6: 
  5.         right = True  
  6.     else
  7.         right = False 
  8.     def __init__(self): 
  9.         self.age = 100 
  10.         self.address = '上海' 

大家注意这几行代码:

  1. a = 1 + 1 
  2. b = 2 + 2 
  3. if a + b == 6: 
  4.     right = True  
  5. else
  6.     right = False 

他们不在任何方法里面的,这里面初始化的变量,叫做类变量或者类属性。而在__init__里面,初始化的self.age和self.address叫做实例属性。

实例属性只有在类被执行的时候,获得实例对象的时候,才会执行。而类属性,是在类被 Python 加载的时候,就会执行。大家注意下面这段代码:

Python 只是加载了这个类,并没有初始化它,但里面的 print语句已经执行了。

而当我们初始化它以后,实例属性才会执行:

什么情况叫做Python 加载了一个类呢?

例如,当你from xxx import yyy的时候,yyy这个类就被加载了。又比如你可能是使用imortlib.import_module的时候。

所以,回到这个同学的问题。之所以他其中一个爬虫的代码始终会运行,原因就在下面红色圆圈中的代码:

他把这段代码写在了所有方法之外,让他处于了类属性的区域。在这个区域里面的代码,在爬虫类被加载的时候,就会执行。

如果要解决这个问题,只需要把这段代码,放到start_requests()方法里面就可以了。

本文转载自微信公众号「未闻Code」,可以通过以下二维码关注。转载本文请联系未闻Code公众号。

 

来源:未闻Code内容投诉

免责声明:

① 本站未注明“稿件来源”的信息均来自网络整理。其文字、图片和音视频稿件的所属权归原作者所有。本站收集整理出于非商业性的教育和科研之目的,并不意味着本站赞同其观点或证实其内容的真实性。仅作为临时的测试数据,供内部测试之用。本站并未授权任何人以任何方式主动获取本站任何信息。

② 本站未注明“稿件来源”的临时测试数据将在测试完成后最终做删除处理。有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

软考中级精品资料免费领

  • 历年真题答案解析
  • 备考技巧名师总结
  • 高频考点精准押题
  • 2024年上半年信息系统项目管理师第二批次真题及答案解析(完整版)

    难度     813人已做
    查看
  • 【考后总结】2024年5月26日信息系统项目管理师第2批次考情分析

    难度     354人已做
    查看
  • 【考后总结】2024年5月25日信息系统项目管理师第1批次考情分析

    难度     318人已做
    查看
  • 2024年上半年软考高项第一、二批次真题考点汇总(完整版)

    难度     435人已做
    查看
  • 2024年上半年系统架构设计师考试综合知识真题

    难度     224人已做
    查看

相关文章

发现更多好内容

猜你喜欢

AI推送时光机
位置:首页-资讯-后端开发
咦!没有更多了?去看看其它编程学习网 内容吧
首页课程
资料下载
问答资讯