爬取整个页面的数据,并进行有效的提取信息,注释都有就不废话了:
public class Reptile { public static void main(String[] args) { String url1=""; //传入你所要爬取的页面地址 InputStream is=null; //创建输入流用于读取流 BufferedReader br=null; //包装流,加快读取速度 StringBuffer html=new StringBuffer(); //用来保存读取页面的数据. String temp=""; //创建临时字符串用于保存每一次读的一行数据,然后html调用append方法写入temp; try { URL url2 = new URL(url1); //获取URL; is = url2.openStream(); //打开流,准备开始读取数据; br= new BufferedReader(new InputStreamReader(is)); //将流包装成字符流,调用br.readLine()可以提高读取效率,每次读取一行; while ((temp = br.readLine()) != null) {//读取数据,调用br.readLine()方法每次读取一行数据,并赋值给temp,如果没数据则值==null,跳出循环; html.append(temp); //将temp的值追加给html,这里注意的时String跟StringBuffere的区别前者不是可变的后者是可变的; } //System.out.println(html); //打印出爬取页面的全部代码; if(is!=null) //接下来是关闭流,防止资源的浪费; { is.close(); is=null; } Document doc=Jsoup.parse(html.toString()); //通过Jsoup解析页面,生成一个document对象; Elements elements=doc.getElementsByClass("XX");//通过class的名字得到(即XX),一个数组对象Elements里面有我们想要的数据,至于这个div的值呢你打开浏览器按下F12就知道了; for (Element element:elements) { System.out.println(element.text()); //打印出每一个节点的信息;你可以选择性的保留你想要的数据,一般都是获取个固定的索引; } } catch (MalformedURLException e) { // TODO Auto-generated catch block e.printStackTrace(); } catch (IOException e) { // TODO Auto-generated catch block e.printStackTrace(); } }
免责声明:
① 本站未注明“稿件来源”的信息均来自网络整理。其文字、图片和音视频稿件的所属权归原作者所有。本站收集整理出于非商业性的教育和科研之目的,并不意味着本站赞同其观点或证实其内容的真实性。仅作为临时的测试数据,供内部测试之用。本站并未授权任何人以任何方式主动获取本站任何信息。
② 本站未注明“稿件来源”的临时测试数据将在测试完成后最终做删除处理。有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341
软考中级精品资料免费领
- 历年真题答案解析
- 备考技巧名师总结
- 高频考点精准押题
- 资料下载
- 历年真题
193.9 KB下载数260
191.63 KB下载数245
143.91 KB下载数1139
183.71 KB下载数640
644.84 KB下载数2752
相关文章
发现更多好内容猜你喜欢
AI推送时光机JAVA超级简单的爬虫实例讲解
后端开发2023-05-30
java 爬虫详解及简单实例
后端开发2023-05-31
node.js实现简单爬虫示例详解
后端开发2023-05-17
Java 使用maven实现Jsoup简单爬虫案例详解
后端开发2024-04-02
python爬虫入门教程(非常详细),超级简单的Python爬虫教程
后端开发2023-09-01
Python爬虫必备之Xpath简介及实例讲解
后端开发2024-04-02
python实现简单爬虫功能的示例
后端开发2022-06-04
java实现一个简单的网络爬虫代码示例
后端开发2023-05-30
java编程实现简单的网络爬虫示例过程
后端开发2024-04-02
一个PHP实现的轻量级简单爬虫
后端开发2023-08-31
基于Python的简单40例和爬虫详细讲解(文末赠书)
后端开发2023-08-31
java Spring Boot2.7实现一个简单的爬虫功能
后端开发2023-10-03
nodeJS实现简单网页爬虫功能的实例(分享)
后端开发2022-06-04
java简单工厂模式实例及讲解
后端开发2024-04-02
基于spring中的aop简单实例讲解
后端开发2023-05-31
Java实现超简单抖音去水印的示例详解
后端开发2024-04-02
Node之简单的前后端交互(实例讲解)
后端开发2022-06-04
Java超详细讲解设计模式之一的单例模式
后端开发2024-04-02
通过实例简单讲解Android App中的Activity组件
后端开发2022-06-06
java StringBuilder类的详解及简单实例
后端开发2023-05-31
咦!没有更多了?去看看其它编程学习网 内容吧