文章详情

短信预约-IT技能 免费直播动态提醒

请输入下面的图形验证码

提交验证

短信预约提醒成功

php如何只获取文章文字内容

2023-07-04 16:53

关注

这篇“php如何只获取文章文字内容”文章的知识点大部分人都不太理解,所以小编给大家总结了以下内容,内容详细,步骤清晰,具有一定的借鉴价值,希望大家阅读完这篇文章能有所收获,下面我们一起来看看这篇“php如何只获取文章文字内容”文章吧。

php有什么用

php是一个嵌套的缩写名称,是英文超级文本预处理语言,它的语法混合了C、Java、Perl以及php自创新的语法,主要用来做网站开发,许多小型网站都用php开发,因为php是开源的,从而使得php经久不衰。

php只获取文章文字内容的方法:1、创建一个PHP示例文件;2、通过定义“function curl_request ( $url , $post = '' , $cookie = '' ,  $returnCookie = 0 ) {...}”方法实现只抓取网页文字内容,并过滤其标签即可。

php只抓取网页body文字内容,并过滤网页标签

代码如下:

<?php function curl_request ( $url , $post = '' , $cookie = '' ,  $returnCookie = 0 ) {     $ua = $ua==''?$_SERVER ['HTTP_USER_AGENT']:'Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1; SV1; QQDownload 732; .NET4.0C; .NET4.0E; LBBROWSER)' ;            $curl  =  curl_init ( ) ;            curl_setopt ( $curl , CURLOPT_URL ,  $url ) ;            curl_setopt ( $curl , CURLOPT_USERAGENT , $ua ) ;            curl_setopt ( $curl , CURLOPT_FOLLOWLOCATION ,  1 ) ;            curl_setopt ( $curl , CURLOPT_AUTOREFERER ,  1 ) ;            curl_setopt ( $curl , CURLOPT_REFERER ,  "https://www.baidu.com" ) ;            if ( $post )  {                 curl_setopt ( $curl , CURLOPT_POST ,  1 ) ;                 curl_setopt ( $curl , CURLOPT_POSTFIELDS ,  http_build_query ( $post ) ) ;            }            if ( $cookie )  {                 curl_setopt ( $curl , CURLOPT_COOKIE ,  $cookie ) ;            }            curl_setopt($curl, CURLOPT_SSL_VERIFYPEER, false);            curl_setopt($curl, CURLOPT_SSL_VERIFYHOST, false);            curl_setopt ( $curl , CURLOPT_HEADER ,  $returnCookie ) ;            curl_setopt ( $curl , CURLOPT_TIMEOUT ,  10 ) ;            curl_setopt ( $curl , CURLOPT_RETURNTRANSFER ,  1 ) ;            $data  =  curl_exec ( $curl ) ;            if  ( curl_errno ( $curl ) )  {                 return  curl_error ( $curl ) ;            }            curl_close ( $curl ) ;            if ( $returnCookie ) {                 list ( $header ,  $body )  =  explode ( "\r\n\r\n" ,  $data ,  2 ) ;                 preg_match_all ( "/Set\-Cookie:([^;]*);/" ,  $header ,  $matches ) ;                 $info [ 'cookie' ]   =  substr ( $matches [ 1 ] [ 0 ] ,  1 ) ;                 $info [ 'content' ]  =  $body ;                 return  $info ;            } else {                 //return  $data ;                 $data=mb_convert_encoding($data, 'UTF-8', 'UTF-8,GBK,GB2312,BIG5');                preg_match("/<body.*?>(.*?)<\/body>/is",$data,$match);                $str= trim($match[1]);      $html = strip_tags($str);    $html_len = mb_strlen($html,'UTF-8');    $html = mb_substr($html, 0, strlen($html), 'UTF-8');    $search = array(" "," ","\n","\r","\t");    $replace = array("","","","","");    echo str_replace($search, $replace, $html);            }}curl_request ( $url, $post = '' , $cookie = '' ,  $returnCookie = 0 );?>

以上就是关于“php如何只获取文章文字内容”这篇文章的内容,相信大家都有了一定的了解,希望小编分享的内容对大家有帮助,若想了解更多相关的知识内容,请关注编程网行业资讯频道。

阅读原文内容投诉

免责声明:

① 本站未注明“稿件来源”的信息均来自网络整理。其文字、图片和音视频稿件的所属权归原作者所有。本站收集整理出于非商业性的教育和科研之目的,并不意味着本站赞同其观点或证实其内容的真实性。仅作为临时的测试数据,供内部测试之用。本站并未授权任何人以任何方式主动获取本站任何信息。

② 本站未注明“稿件来源”的临时测试数据将在测试完成后最终做删除处理。有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

软考中级精品资料免费领

  • 历年真题答案解析
  • 备考技巧名师总结
  • 高频考点精准押题
  • 2024年上半年信息系统项目管理师第二批次真题及答案解析(完整版)

    难度     813人已做
    查看
  • 【考后总结】2024年5月26日信息系统项目管理师第2批次考情分析

    难度     354人已做
    查看
  • 【考后总结】2024年5月25日信息系统项目管理师第1批次考情分析

    难度     318人已做
    查看
  • 2024年上半年软考高项第一、二批次真题考点汇总(完整版)

    难度     435人已做
    查看
  • 2024年上半年系统架构设计师考试综合知识真题

    难度     224人已做
    查看

相关文章

发现更多好内容

猜你喜欢

AI推送时光机
位置:首页-资讯-后端开发
咦!没有更多了?去看看其它编程学习网 内容吧
首页课程
资料下载
问答资讯