white7782 发表于 2008-3-5 22:26:49

求救,内容页分页不规则怎么采,跪求高手帮忙

第1个页面的代码:

<div align=right>本新闻共<font color=red>3</font>页,当前在第<font color=red>1</font>页<a href=0652214243199651_2.htm>下一页</a></div></SPAN></FONT> </P>


第2个页面的代码:

<div align=right>本新闻共<font color=red>3</font>页,当前在第<font color=red>2</font>页<a href=0652214243199651.htm>首页</a><a href=0652214243199651.htm>上一页</a><a href=0652214243199651_3.htm>下一页</a></div></SPAN></FONT> </P>

最后页面的代码:

<div align=right>本新闻共<font color=red>3</font>页,当前在第<font color=red>3</font>页<a href=0652214243199651.htm>首页</a><a href=0652214243199651_2.htm>上一页</a></div></SPAN></FONT>

自动采集不了啊

跪求高手帮忙,谢谢:(

飛越無限 发表于 2008-3-5 22:40:36

你写的时候开始代码为<div align=right>本新闻共结束用</div>就可以了

white7782 发表于 2008-3-5 22:47:52

全部列出模式和上下页面模式要选择哪个?或者都不选(好像不能都不选)

fireye 发表于 2008-3-5 22:50:12

首页</a>   </SPAN></FONT>

white7782 发表于 2008-3-5 22:57:03

原帖由 fireye 于 2008-3-5 22:50 发表 http://bbs.locoy.com/images/common/back.gif
首页      


这个不对。第一个页面没有

white7782 发表于 2008-3-5 23:01:39

原帖由 飛越無限 于 2008-3-5 22:40 发表 http://bbs.locoy.com/images/common/back.gif
你写的时候开始代码为本新闻共结束用就可以了


我选择上下页模式的,也采集不了

fireye 发表于 2008-3-5 23:41:33

那你用正则参数吧,注意加上域名前缀.

ws123 发表于 2008-3-6 10:48:42

有点类似这个:http://bbs.locoy.com/spider-23116-1-1.html

首先,内容规则要填写好,
开始代码:...
结束代码:...

然后,分页规则要填写好,可任选2种模式中的一种即可,例如点选“全部列出模式”,
开始代码:<div align=right>
结束代码:</div>
点选“自动识别分页”

“分页内容合并连接代码”可以填写“<br><br>”。应该可以了。

white7782 发表于 2008-3-7 22:32:54

可以采集了。升级到sp5就可以
页: [1]
查看完整版本: 求救,内容页分页不规则怎么采,跪求高手帮忙