火车采集器软件交流官方论坛

 找回密码
 加入会员
搜索
火车采集器V9版免费下载火车浏览器 - 可视采集,万能群发,全自动脚本工具
查看: 2507|回复: 7

一个超难的分页采集,等高手来帮忙

[复制链接]
发表于 2009-8-18 20:59:44 | 显示全部楼层 |阅读模式
http://www.yxlady.com/starsigns/200907/257699.shtml

分页标签内容
<P taggedby="hylanda"><div class='showpage'><a class='pages_hov' >1</a>&nbsp;<a href='/starsigns/200907/257699_2.shtml' class='pages'>2</a><a href='/starsigns/200907/257699_3.shtml' class='pages'>3</a><a href='/starsigns/200907/257699_4.shtml' class='pages'>4</a><a href='/starsigns/200907/257699_5.shtml' class='pages'>5</a> <a class='shenglve'  >......</a> <a href='/starsigns/200907/257699_2.shtml' class='nextpage'>下一页</a> <a href='/starsigns/200907/257699_6.shtml' class='endpage'>下5页</a></div></p></div></span>
<script type="text/javascript" src="/Skin/2009nyjs/extend_4.js"></script>


http://www.yxlady.com/starsigns/200908/259936.shtml   这个文章里没有分页标签,也就是说如果要采集文章内容就是结束规

则要用谷歌的广告<script type="text/javascript" src="/Skin/2009nyjs/extend_4.js"></script>,可这样子问题又来了,那采

集有分页内容的文章时会把1 2  3  4  5 2345 ......  下一页  下5页 采集到内容里去,该怎么才能把它过滤掉呀??

最重要的是分页怎么采集,希望版主和高手能帮助我一下,在此万分感谢。

总的来说,我就想采集http://www.yxlady.com/starsigns/List/List_318.shtml这个频道。
 楼主| 发表于 2009-8-20 14:49:03 | 显示全部楼层
顶起来啊,不要沉
发表于 2009-8-21 10:34:26 | 显示全部楼层
从<a class='shenglve'  >



下一页

使用上一页下一页的模式采集。
发表于 2009-8-21 11:14:39 | 显示全部楼层
这就是传说 的中超难!!!!{:4_196:}
 楼主| 发表于 2009-8-21 21:19:00 | 显示全部楼层
呵呵,对我来说就是很难呀,管理员,我照你说的,还是采集不了啊
 楼主| 发表于 2009-8-21 21:20:11 | 显示全部楼层
ali50ls呵呵,对我来说就是很难呀,管理员,我照你说的,还是采集不了啊
发表于 2009-8-22 11:14:42 | 显示全部楼层
来看看是什么!

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?加入会员

x

评分

1

查看全部评分

 楼主| 发表于 2009-8-23 12:33:06 | 显示全部楼层
美女来了一个呀~~~
您需要登录后才可以回帖 登录 | 加入会员

本版积分规则

企业微信|手机版|Archiver|火车采集器官方站 ( 皖ICP备06000549 )

GMT+8, 2026-4-29 02:03

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表