PHP · 2014/04/07 0

phpQuery实现网页内容采集

在社区晃悠发现这个好东西,不仅仅是采集方便,对于学习过jQuery的同胞也是一大福音,因为语法基本是一样的,

也就是我们可以使用jQuery的语法在php上完成采集网页后对网页内容的解析,这完全就是个dom操作,爽歪歪啊,

陈捷用csdn写了个小例子,采集csdn的首页中部的文章列表。

实现代码如下(感觉没啥好解释的,看看代码吧)

<?php
header('content-type:text/html;charset=utf-8');
include 'phpQuery.php'; //这里的引入代码文件请自行去http://code.google.com/p/phpquery/下载最新的吧。
phpQuery::newDocumentFile('http://www.csdn.net'); 
$artlist = pq(".news_list"); 
foreach($artlist as $ul){ 
   echo pq($ul)->find('ul')->html()."<br/>";
}
?>

效果如下:
csdn-caiji