文章详情

短信预约-IT技能 免费直播动态提醒

请输入下面的图形验证码

提交验证

短信预约提醒成功

Python中怎么保存搜索引擎结果

2023-06-17 15:58

关注

本篇文章给大家分享的是有关Python中怎么保存搜索引擎结果,小编觉得挺实用的,因此分享给大家学习,希望大家阅读完这篇文章后可以有所收获,话不多说,跟着小编一起来看看吧。

  1. #!/usr/bin/env python  

  2. #-*- encoding:utf-8 -*-  

  3. import sys  

  4. import re  

  5. import httplib  

  6. def request_and_save(conn, query_str, f):  

  7. conn.request(”GET”, query_str)  

  8. r1 = conn.getresponse()  

  9. line = r1.read()  

  10. p1 = re.compile(”<a href=”)  

  11. p2 = re.compile(”</a>”)  

  12. match_start = 0 

  13. match_end = 0 

  14. while line:  

  15. m = p1.search(line)  

  16. if m is None:  

  17. break  

  18. mmatch_start = m.start()  

  19. lineline = line[match_start:]  

  20. m = p2.search(line)  

  21. if m is None:  

  22. break  

  23. mmatch_end = m.end()  

  24. item = line[:match_end]  

  25. if item.find(”class=l”) == -1:  

  26. lineline = line[match_end:]  

  27. continue  

  28. f.write(item)  

  29. f.write(”<br>\n”);  

  30. lineline = line[match_end:]  

  31. # end function  

  32. if len(sys.argv) < 2: 

  33. print “Usage: google.py words”  

  34. sys.exit(0)  

  35. query_str = “/search?aq=f\&complete=1\&hl=zh-CN\&newwind
    ow=1\&q=” + sys.argv[1]  

  36. query_str2 = “/search?q=” + sys.argv[1] + “\&complete=1\
    &hl=zh-CN\&newwindow=1\&start=10\&sa=N”  

  37. query_str3 = “/search?q=” + sys.argv[1] + “\&complete=1\
    &hl=zh-CN\&newwindow=1\&start=20\&sa=N”  

  38. query_str4 = “/search?q=” + sys.argv[1] + “\&complete=1\
    &hl=zh-CN\&newwindow=1\&start=30\&sa=N”  

  39. query_str5 = “/search?q=” + sys.argv[1] + “\&complete=1\
    &hl=zh-CN\&newwindow=1\&start=40\&sa=N”  

  40. query_str6 = “/search?q=” + sys.argv[1] + “\&complete=1\
    &hl=zh-CN\&newwindow=1\&start=50\&sa=N”  

  41. query_str7 = “/search?q=” + sys.argv[1] + “\&complete=1\
    &hl=zh-CN\&newwindow=1\&start=60\&sa=N”  

  42. html_header = “<html><head><meta http-equiv=\”content-type\” 
    content=\”text/html;charset=gb2312\”><title>kf701 python 
    search tool</title></head><body>\n”  

  43. html_header += “<p align=center><font size=3>kf701 python 
    search tool</font></p>”  

  44. html_end = “</body></html>”  

  45. conn = httplib.HTTPConnection(”www.google.cn“)  

  46. print &lsquo;Search &lsquo; + sys.argv[1] + &lsquo;, Save result in &lsquo; + sys.
    argv[1] + &lsquo;-search.html&rsquo;  

  47. f = file( sys.argv[1] + “-search.html”, “w”)  

  48. f.write(html_header);  

  49. request_and_save(conn, query_str, f)  

  50. request_and_save(conn, query_str2, f)  

  51. request_and_save(conn, query_str3, f)  

  52. request_and_save(conn, query_str4, f)  

  53. request_and_save(conn, query_str5, f)  

  54. request_and_save(conn, query_str6, f)  

  55. request_and_save(conn, query_str7, f)  

  56. f.write(html_end)  

  57. f.close()  

  58. conn.close() 

以上就是Python中怎么保存搜索引擎结果,小编相信有部分知识点可能是我们日常工作会见到或用到的。希望你能通过这篇文章学到更多知识。更多详情敬请关注编程网行业资讯频道。

阅读原文内容投诉

免责声明:

① 本站未注明“稿件来源”的信息均来自网络整理。其文字、图片和音视频稿件的所属权归原作者所有。本站收集整理出于非商业性的教育和科研之目的,并不意味着本站赞同其观点或证实其内容的真实性。仅作为临时的测试数据,供内部测试之用。本站并未授权任何人以任何方式主动获取本站任何信息。

② 本站未注明“稿件来源”的临时测试数据将在测试完成后最终做删除处理。有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

软考中级精品资料免费领

  • 历年真题答案解析
  • 备考技巧名师总结
  • 高频考点精准押题
  • 2024年上半年信息系统项目管理师第二批次真题及答案解析(完整版)

    难度     813人已做
    查看
  • 【考后总结】2024年5月26日信息系统项目管理师第2批次考情分析

    难度     354人已做
    查看
  • 【考后总结】2024年5月25日信息系统项目管理师第1批次考情分析

    难度     318人已做
    查看
  • 2024年上半年软考高项第一、二批次真题考点汇总(完整版)

    难度     435人已做
    查看
  • 2024年上半年系统架构设计师考试综合知识真题

    难度     224人已做
    查看

相关文章

发现更多好内容

猜你喜欢

AI推送时光机
位置:首页-资讯-后端开发
咦!没有更多了?去看看其它编程学习网 内容吧
首页课程
资料下载
问答资讯