一个超难的分页采集,等高手来帮忙
http://www.yxlady.com/starsigns/200907/257699.shtml分页标签内容
<P taggedby="hylanda"><div class='showpage'><a class='pages_hov' >1</a> <a href='/starsigns/200907/257699_2.shtml' class='pages'>2</a><a href='/starsigns/200907/257699_3.shtml' class='pages'>3</a><a href='/starsigns/200907/257699_4.shtml' class='pages'>4</a><a href='/starsigns/200907/257699_5.shtml' class='pages'>5</a> <a class='shenglve'>......</a> <a href='/starsigns/200907/257699_2.shtml' class='nextpage'>下一页</a> <a href='/starsigns/200907/257699_6.shtml' class='endpage'>下5页</a></div></p></div></span>
<script type="text/javascript" src="/Skin/2009nyjs/extend_4.js"></script>
http://www.yxlady.com/starsigns/200908/259936.shtml 这个文章里没有分页标签,也就是说如果要采集文章内容就是结束规
则要用谷歌的广告<script type="text/javascript" src="/Skin/2009nyjs/extend_4.js"></script>,可这样子问题又来了,那采
集有分页内容的文章时会把1 2345 2345 ......下一页下5页 采集到内容里去,该怎么才能把它过滤掉呀??
最重要的是分页怎么采集,希望版主和高手能帮助我一下,在此万分感谢。
总的来说,我就想采集http://www.yxlady.com/starsigns/List/List_318.shtml这个频道。 ali65ls 顶起来啊,不要沉 从<a class='shenglve'>
到
下一页
使用上一页下一页的模式采集。 这就是传说 的中超难!!!!{:4_196:} 呵呵,对我来说就是很难呀,管理员,我照你说的,还是采集不了啊 ali50ls呵呵,对我来说就是很难呀,管理员,我照你说的,还是采集不了啊 来看看是什么!
美女来了一个呀~~~
页:
[1]