|
情况如下:
某网址列表页 http://www.xxx.com/list.php?id=312
该列表页中的内容数量是变动的,时增时减。 可能只有1页,也可能会出现多页。
1页的情况 http://www.xxx.com/list.php?id=312
多页的情况 http://www.xxx.com/list.php?id=312&pages=(*) *=1...5
列表页分了多少页是可以采集到的:
自己写了个小程序,有错。就是系统默认$LabelUrl是个一维的,只能接受一个地址,多页的情况就有多个地址。无法接受,请高手修改!
function rewriteurl($urlin,$pagesin)
{
$urlin= $urlin ."&page=". $pagesin;
return $urlin;
}
if($LabelArray['Html'])
{
$htmlurl=$LabelUrl;
if($LabelArray['PageType']=='List')
{
$urlArr=array(); //用于测试
$LabelUrl=array(); //强行重定义
if($LabelArray['pages'] > 1) //$LabelArray['pages'] 是采集到的页面数
{
for($i=1; $i<$LabelArray['pages']; $i++)
{
$url = rewriteurl($htmlurl,$i);
$urlArr[]=$url;
$LabelUrl[]=$url; //这样写没有效果
}
}
}
还请各位高手帮忙。 |
本帖子中包含更多资源
您需要 登录 才可以下载或查看,没有帐号?加入会员
x
|