pottics 发表于 2009-8-18 20:59:44

一个超难的分页采集,等高手来帮忙

http://www.yxlady.com/starsigns/200907/257699.shtml

分页标签内容
<P taggedby="hylanda"><div class='showpage'><a class='pages_hov' >1</a>&nbsp;<a href='/starsigns/200907/257699_2.shtml' class='pages'>2</a><a href='/starsigns/200907/257699_3.shtml' class='pages'>3</a><a href='/starsigns/200907/257699_4.shtml' class='pages'>4</a><a href='/starsigns/200907/257699_5.shtml' class='pages'>5</a> <a class='shenglve'>......</a> <a href='/starsigns/200907/257699_2.shtml' class='nextpage'>下一页</a> <a href='/starsigns/200907/257699_6.shtml' class='endpage'>下5页</a></div></p></div></span>
<script type="text/javascript" src="/Skin/2009nyjs/extend_4.js"></script>


http://www.yxlady.com/starsigns/200908/259936.shtml   这个文章里没有分页标签,也就是说如果要采集文章内容就是结束规

则要用谷歌的广告<script type="text/javascript" src="/Skin/2009nyjs/extend_4.js"></script>,可这样子问题又来了,那采

集有分页内容的文章时会把1 2345 2345 ......下一页下5页 采集到内容里去,该怎么才能把它过滤掉呀??

最重要的是分页怎么采集,希望版主和高手能帮助我一下,在此万分感谢。

总的来说,我就想采集http://www.yxlady.com/starsigns/List/List_318.shtml这个频道。

pottics 发表于 2009-8-20 14:49:03

ali65ls 顶起来啊,不要沉

vus520 发表于 2009-8-21 10:34:26

从<a class='shenglve'>



下一页

使用上一页下一页的模式采集。

aven 发表于 2009-8-21 11:14:39

这就是传说 的中超难!!!!{:4_196:}

pottics 发表于 2009-8-21 21:19:00

呵呵,对我来说就是很难呀,管理员,我照你说的,还是采集不了啊

pottics 发表于 2009-8-21 21:20:11

ali50ls呵呵,对我来说就是很难呀,管理员,我照你说的,还是采集不了啊

阿星 发表于 2009-8-22 11:14:42

来看看是什么!

pottics 发表于 2009-8-23 12:33:06

美女来了一个呀~~~
页: [1]
查看完整版本: 一个超难的分页采集,等高手来帮忙