php小编西瓜为您介绍Colly这个强大的网络爬虫框架。Colly是一个使用Go语言编写的简单而灵活的爬虫框架,它提供了丰富的功能,包括获取HTML元素、提取数据以及处理请求和响应等。在使用Colly时,有时我们需要获取HTML元素的子属性的值,比如获取一个链接的href属性。那么,如何在Colly中获取子属性的值呢?接下来,我们将一一为您解答。
问题内容
这是我一直在 上工作的示例页面https://www.lazada.vn/-i1701980654-s7563711492.html
这是我想要获取的元素(产品标题)
...
yierku 【free shipping miễn phí vận chuyển】giày nam mùa thu và mùa đông giày thường xu hướng nam thể thao tất cả các trận đấu giày da tăng chiều cao giày nam
...
我想获取
元素之间的文本值,即 yierku 【免费送货 miễn phí vận chuyển】giày n....
这是我迄今为止尝试过的
c := colly.NewCollector()
c.OnError(func(_ *colly.Response, err error) {
log.Println("Something went wrong:", err)
})
c.OnXML("/html/body", func(e *colly.XMLElement) {
child := e.ChildAttrs("div[4]/div/div[3]/div[2]/div/div[1]/div[3]/div/div/h1", "class")
fmt.Println(child)
//fmt.Println(child)
})
它给出了 pdp-mod-product-badge-title
的响应
当我尝试将其更改为
child := e.childattrs("div[4]/div/div[3]/div[2]/div/div[1]/div[3]/div/div/h1", "文本" )
它没有给我任何结果
解决方法
使用 func (*xmlelement) childtext相反。
package main
import (
"fmt"
"github.com/gocolly/colly/v2"
)
func main() {
c := colly.NewCollector()
c.OnError(func(_ *colly.Response, err error) {
fmt.Println("Something went wrong:", err)
})
c.OnXML("/html/body", func(e *colly.XMLElement) {
child := e.ChildText("div[4]/div/div[3]/div[2]/div/div[1]/div[3]/div/div/h1")
fmt.Println(child)
})
c.Visit("https://www.lazada.vn/-i1701980654-s7563711492.html")
// Output:
// Yierku 【Free Shipping Miễn phí vận chuyển】Giày nam mùa thu và mùa đông giày thường xu hướng nam thể thao tất cả các trận đấu giày da tăng chiều cao giày nam
}
以上就是Colly - 如何获取子属性的值?的详细内容,更多请关注编程网其它相关文章!
免责声明:
① 本站未注明“稿件来源”的信息均来自网络整理。其文字、图片和音视频稿件的所属权归原作者所有。本站收集整理出于非商业性的教育和科研之目的,并不意味着本站赞同其观点或证实其内容的真实性。仅作为临时的测试数据,供内部测试之用。本站并未授权任何人以任何方式主动获取本站任何信息。
② 本站未注明“稿件来源”的临时测试数据将在测试完成后最终做删除处理。有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341
软考中级精品资料免费领
- 历年真题答案解析
- 备考技巧名师总结
- 高频考点精准押题
- 资料下载
- 历年真题
193.9 KB下载数265
191.63 KB下载数245
143.91 KB下载数1142
183.71 KB下载数642
644.84 KB下载数2755
相关文章
发现更多好内容猜你喜欢
AI推送时光机Colly - 如何获取子属性的值?
后端开发2024-02-11vueref如何获取子组件属性值
后端开发2024-04-02MyBatis 如何获取子类的属性
后端开发2021-12-28jquery如何获取class属性的值
后端开发2023-06-06js如何获取css属性值
后端开发2024-04-02springboot如何获取properties属性值
后端开发2023-06-29vue ref怎么获取子组件属性值
后端开发2023-06-29如何获取div的自定义属性值
后端开发2024-04-02springboot如何获取yml里面的属性值
后端开发2024-04-02Java反射如何获取字段属性值
后端开发2024-04-02jQuery如何获取属性?
后端开发2024-04-08jQuery如何获取属性?
后端开发2024-04-02jquery如何获取属性
后端开发2024-04-02js如何获取标签元素data-*属性值
后端开发2023-06-30jQuery如何在元素上获取特定属性的值?
后端开发2024-04-02jquery如何获取checked属性
后端开发2024-04-02python怎么获取对象的属性值
后端开发2023-10-18JavaScript如何根据属性获取属性的父级
后端开发2023-06-27php怎么获取对象的属性值
后端开发2023-10-18Java如何通过反射获取对象的属性和值
后端开发2024-04-02 咦!没有更多了?去看看其它编程学习网 内容吧