您正在使用IPV4(44.192.247.184)访问本站 您本次共访问本站 1 次
 用户名: 密 码: 验证码:     用QQ登录本站
首页 软件 编程 笑话 知识 公告 台风 日历 计算器
悟空收录网       [公益]文明驾车我带头,文明行路我带头,礼貌让座我带头      

【腾讯云】云服务器等爆品抢先购,低至4.2元/月      
[公益] 节省一分零钱 献出一份爱心 温暖世间真情      
2023年 元宵节 4
2023年 情人节 13
2024年 元 旦 334
2024年 春 节 374
 
您现在的位置:首页 >> PHP >> 内容
本类新增
本类热门文章
php获得网页源代码抓取网页内容的几种方法
内容摘要: 1、使用file_get_contents获得网页源代码这个方法最常用,只需要两行代码即可,非常简单方便。参考代码:?php$fh=file_get_contents('http://www.yc58.com/');echo$fh;?2、使用fopen获得网页源代码这个方法用的人也不少,不过代码有点多。参考代码:?php$fh=fopen('http://w......
1、使用file_get_contents获得网页源代码

这个方法最常用,只需要两行代码即可,非常简单方便。

参考代码:

<?php

$fh=file_get_contents('http://www.yc58.com/');

echo$fh;

?>

2、使用fopen获得网页源代码

这个方法用的人也不少,不过代码有点多。

参考代码:

<?php

$fh=fopen('http://www.yc58.com/','r');

if($fh){

while(!feof($fh)){

echofgets($fh);

}

}

?>

3、使用curl获得网页源代码

使用curl获得网页源代码的做法,往往是需要更高要求的人使用,例如当你需要在抓取网页内容的同时,得到网页header信息,还有ENCODING编码的使用,USERAGENT的使用等等。

参考代码一:

<?php

//创建一个新cURL资源

$ch=curl_init();

//设置URL和相应的选项

curl_setopt($ch,CURLOPT_URL,"http://www.yc58.com/");

curl_setopt($ch,CURLOPT_HEADER,false);

//抓取URL并把它传递给浏览器

$data=curl_exec($ch);

echo$data;

//关闭cURL资源,并且释放系统资源

curl_close($ch);

?>

参考代码二:

<?php

$szUrl="http://www.yc58.com/";

$UserAgent='Mozilla/4.0(compatible;MSIE7.0;WindowsNT6.0;SLCC1;.NETCLR2.0.50727;.NETCLR3.0.04506;.NETCLR3.5.21022;.NETCLR1.0.3705;.NETCLR1.1.4322)';

$curl=curl_init();

curl_setopt($curl,CURLOPT_URL,$szUrl);

curl_setopt($curl,CURLOPT_HEADER,0);//0表示不输出Header,1表示输出

curl_setopt($curl,CURLOPT_RETURNTRANSFER,1);

curl_setopt($curl,CURLOPT_SSL_VERIFYPEER,false);

curl_setopt($curl,CURLOPT_SSL_VERIFYHOST,false);

curl_setopt($curl,CURLOPT_ENCODING,'');

curl_setopt($curl,CURLOPT_USERAGENT,$UserAgent);

curl_setopt($curl,CURLOPT_FOLLOWLOCATION,1);

$data=curl_exec($curl);

echo$data;

//echocurl_errno($curl);//返回0时表示程序执行成功如何从curl_errno返回值获取错误信息

exit();

?>

上例里使用了几个curl_setopt()参数的定义,HEADER、ENCODING、USERAGENT等,可以参考这里http://cn2.php.net/curl_setopt查看更多参数及用途。

需要注意的是,在使用curl_init()之前,你需要做下php.ini的安全设置,否则该函数不能执行。

版权声明:本内容来源于网络,如有侵犯您的版权,请联系站长,本站收到您的信息后将及时处理。
上一篇:PHP先等比缩放再无损裁剪图片 下一篇:PHP使用函数删除网站旧照片的方法
发布日期:2023/1/9
手机扫二维码直达本页
发布时间:14:02:12
点  击:38
录  入:壹家怡园
相关文章
Baidu

YiJiaCMS 6.3.5.220928(MSSQL) 闽ICP备05000814号-1
本空间由腾讯云(轻量应用服务器)提供,百度云加速提供加速防护
Copyright©2000-2023