php抓取网页源代码的几种方法

这里收集了几种利用php获得网页源代码的方法，可以根据实际需要选用。

1、使用file_get_contents获得网页源代码

这个方法比较常用，只需要两行代码即可，非常简单方便。

参考代码：

<?php
    $fh= file_get_contents('http://www.ecjson.com/');
    echo $fh;
?>

2、使用fopen获得网页源代码

参考代码：

<?php
$fh = fopen('http://www.ecjson.com/', 'r');
if($fh){
    while(!feof($fh)) {
        echo fgets($fh);
    }
}
?>

3、使用curl获得网页源代码

使用curl获得网页源代码的做法，往往是需要更高要求的人使用，例如当你需要在抓取网页内容的同时，得到网页header信息，还有ENCODING编码的使用，USERAGENT的使用等等。

参考代码：

<?php
// 创建一个新cURL资源
$ch = curl_init();
// 设置URL和相应的选项
curl_setopt ($ch, CURLOPT_URL, "http://www.ecjson.com/");
curl_setopt ($ch, CURLOPT_RETURNTRANSFER, 1);
curl_setopt ($ch, CURLOPT_CONNECTTIMEOUT,20);
// 抓取URL
$res = curl_exec($ch);
//关闭cURL资源，并且释放系统资源
curl_close($ch);
//如果出现乱码使用该语句转码
$res=mb_convert_encoding($res, 'UTF-8', 'UTF-8,GBK,GB2312,BIG5');
?>

上例里使用的curl_setopt()的参数，可以参考这里http://php.net/manual/zh/function.curl-setopt.php查看更多参数及用途。

php抓取网页源代码的几种方法

支付宝和微信付款二维码，赞助后我们会署名显示： 赞助列表

`支付宝`和`微信付款`二维码，赞助后我们会署名显示：赞助列表