python如何使用XPath解析数据爬取起点小说网数据-编程学习网

小编给大家分享一下python如何使用XPath解析数据爬取起点小说网数据，相信大部分人都还不怎么了解，因此分享这篇文章给大家参考一下，希望大家阅读完这篇文章后大有收获，下面让我们一起去了解一下吧！

python的数据类型有哪些?

python的数据类型：1. 数字类型，包括int（整型）、long（长整型）和float（浮点型）。2.字符串，分别是str类型和unicode类型。3.布尔型，Python布尔类型也是用于逻辑运算，有两个值：True（真）和False（假）。4.列表，列表是Python中使用最频繁的数据类型，集合中可以放任何数据类型。5. 元组，元组用”()”标识，内部元素用逗号隔开。6. 字典，字典是一种键值对的集合。7. 集合，集合是一个无序的、不重复的数据组合。

1. xpath 的介绍

xpath是一门在XML文档中查找信息的语言

优点：

可以在xml中找信息
支持HTML的查找
可以通过元素和属性进行导航

但是Xpath需要依赖xml的库，所以我们需要去安装lxml的库。

安装lxml库

我们先要安装lxml的库，直接在pycharm里安装即可：

python如何使用XPath解析数据爬取起点小说网数据

XML的树形结构：

python如何使用XPath解析数据爬取起点小说网数据

元素-元素-属性-文本

使用XPath选取节点：

nodename: 选取此节点的所有节点
/从根节点选择
// 从匹配选择的当前节点选择文档中的节点，而不考虑他们的位置
. 选择当前节点
.. 选择当前节点的父节点（此处是两个点，浏览器默认显示3个..）
/text() 获取当前路径下的文本内容
/@xxx 提取当前路径下标签的属性值

选取节点的表达式举例：

python如何使用XPath解析数据爬取起点小说网数据

2. 爬取起点小说网

在浏览器中获取书名和作者测试

在谷歌里安装一个xpath的插件

python如何使用XPath解析数据爬取起点小说网数据

在html中查找book-mid-info

python如何使用XPath解析数据爬取起点小说网数据

我们要获取小说的名称：也就是 //div[@class='book-mid-info']/h5/a/txt()

python如何使用XPath解析数据爬取起点小说网数据

再加一个获取作者：

python如何使用XPath解析数据爬取起点小说网数据

使用xpath获取起点小说网的数据

import requestsfrom lxml import etreeurl="https://www.qidian.com/rank/yuepiao"headers={'user-agent':'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/70.0.3538.25 Safari/537.36 Core/1.70.3861.400 QQBrowser/10.7.4313.400'}#发送请求resp=requests.get(url,headers)e=etree.HTML(resp.text) #类型转换，把str转变为class 'lxml.etree._ELementprint(type(e))names=e.xpath('//div[@class="book-mid-info"]/h5/a/text()')authors=e.xpath('//p[@class="author"]/a[1]/text()')print(names)print(authors)#名称和作者对应for name,authors in zip(names,authors):    print(name,":",authors)

以上是“python如何使用XPath解析数据爬取起点小说网数据”这篇文章的所有内容，感谢各位的阅读！相信大家都有了一定的了解，希望分享的内容对大家有所帮助，如果还想学习更多知识，欢迎关注编程网行业资讯频道！

文章详情

python如何使用XPath解析数据爬取起点小说网数据

python的数据类型有哪些?

1. xpath 的介绍

优点：

安装lxml库

XML的树形结构：

选取节点的表达式举例：

2. 爬取起点小说网

在浏览器中获取书名和作者测试

使用xpath获取起点小说网的数据

软考中级精品资料免费领

相关文章

猜你喜欢

python如何使用XPath解析数据爬取起点小说网数据

python使用XPath解析数据爬取起点小说网数据

怎么在python中使用xpath爬取网上数据

如何使用Python网络爬虫实现起点小说下载

如何用python爬取网页数据

Python 爬虫：如何用 BeautifulSoup 爬取网页数据

如何使用python爬取电商数据

如何使用Python爬取历年高考数据并分析

如何使用Python爬取各大高校数据

如何用六步教会你使用python爬虫爬取数据

如何使用python爬取知乎热榜Top50数据

如何使用python实现简单爬取网页数据并导入MySQL中的数据库

教你如何使用Python快速爬取需要的数据

在Python中使用requests库爬取数据时返回为空如何解决

如何使用python爬取B站排行榜Top100的视频数据

如何使用python数据处理解决数据冲突和样本的选取

详解如何使用numpy提高Python数据分析效率

如何使用Python解决大数据存储和分析问题？

大数据分析之 Python：如何使用 NumPy 解决数据处理中的瓶颈问题？

使用Python循环读取数据时内存不足如何解决