内容目录
在社区晃悠发现这个好东西,不仅仅是采集方便,对于学习过jQuery的同胞也是一大福音,因为语法基本是一样的,
也就是我们可以使用jQuery的语法在php上完成采集网页后对网页内容的解析,这完全就是个dom操作,爽歪歪啊,
陈捷用csdn写了个小例子,采集csdn的首页中部的文章列表。
实现代码如下(感觉没啥好解释的,看看代码吧)
<?php
header('content-type:text/html;charset=utf-8');
include 'phpQuery.php'; //这里的引入代码文件请自行去http://code.google.com/p/phpquery/下载最新的吧。
phpQuery::newDocumentFile('http://www.csdn.net');
$artlist = pq(".news_list");
foreach($artlist as $ul){
echo pq($ul)->find('ul')->html()."<br/>";
}
?>
