火车采集器软件交流官方论坛

 找回密码
 加入会员
搜索
火车采集器V9版免费下载火车浏览器 - 可视采集,万能群发,全自动脚本工具
查看: 3116|回复: 8

求救,内容页分页不规则怎么采,跪求高手帮忙

[复制链接]
发表于 2008-3-5 22:26:49 | 显示全部楼层 |阅读模式
第1个页面的代码:

<div align=right>本新闻共<font color=red>3</font>页,当前在第<font color=red>1</font>页  <a href=0652214243199651_2.htm>下一页</a></div></SPAN></FONT> </P>


第2个页面的代码:

<div align=right>本新闻共<font color=red>3</font>页,当前在第<font color=red>2</font>页  <a href=0652214243199651.htm>首页</a>  <a href=0652214243199651.htm>上一页</a>  <a href=0652214243199651_3.htm>下一页</a></div></SPAN></FONT> </P>

最后页面的代码:

<div align=right>本新闻共<font color=red>3</font>页,当前在第<font color=red>3</font>页  <a href=0652214243199651.htm>首页</a>  <a href=0652214243199651_2.htm>上一页</a></div></SPAN></FONT>

自动采集不了啊

跪求高手帮忙,谢谢
发表于 2008-3-5 22:40:36 | 显示全部楼层
你写的时候开始代码为<div align=right>本新闻共  结束用</div>就可以了
 楼主| 发表于 2008-3-5 22:47:52 | 显示全部楼层
全部列出模式和上下页面模式要选择哪个?或者都不选(好像不能都不选)
发表于 2008-3-5 22:50:12 | 显示全部楼层
首页</a>     </SPAN></FONT>
 楼主| 发表于 2008-3-5 22:57:03 | 显示全部楼层
原帖由 fireye 于 2008-3-5 22:50 发表
首页      



这个不对。第一个页面没有
 楼主| 发表于 2008-3-5 23:01:39 | 显示全部楼层
原帖由 飛越無限 于 2008-3-5 22:40 发表
你写的时候开始代码为本新闻共  结束用就可以了



我选择上下页模式的,也采集不了
发表于 2008-3-5 23:41:33 | 显示全部楼层
那你用正则参数吧,注意加上域名前缀.
发表于 2008-3-6 10:48:42 | 显示全部楼层
有点类似这个:http://bbs.locoy.com/spider-23116-1-1.html

首先,内容规则要填写好,
开始代码:...
结束代码:...

然后,分页规则要填写好,可任选2种模式中的一种即可,例如点选“全部列出模式”,
开始代码:<div align=right>
结束代码:</div>
点选“自动识别分页”

“分页内容合并连接代码”可以填写“<br><br>”。应该可以了。
 楼主| 发表于 2008-3-7 22:32:54 | 显示全部楼层
可以采集了。升级到sp5就可以
您需要登录后才可以回帖 登录 | 加入会员

本版积分规则

QQ|手机版|Archiver|火车采集器官方站 ( 皖ICP备06000549 )

GMT+8, 2025-7-18 21:59

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表