ezcome 发表于 2008-3-4 22:31:15

帮我看看这个网采集分页怎么设置啊?

http://www.lunwennet.com/thesis/2008/21362.html

上边是网址

我按照教程那样不管怎么设 分页采集都不成功...

ws123 发表于 2008-3-6 19:49:35

这个是比较简易的,可能是设置的时候出错。

过程:
1.设置编码为gb2312,内容标签的开始字符串为<TD style="TABLE-LAYOUT(*)>,结束字符串为<p align='center'>。
2.设置分页区域,点选“全部列出模式”。
3.因为源代码中分页区的字符串为
<p align='center'><b><font color='red'></font>&nbsp;<a href='/thesis/2008/21362_2.html'></a>&nbsp;<a href='/thesis/2008/21362_2.html'>下一页</a>&nbsp;&nbsp;</b></p><SPAN id=ad3></SPAN></TD>
所以,
“从”填写:<p align='center'>
“到”填写:</p>

点选“自动识别分页”,“分页内容合并连接代码”可以填写“<br><br>”。经过测试可以采集到这2页内容。

ws123 发表于 2008-3-6 19:56:26

你有火车车厢0 节,不知怎么支付车厢

yinshulin 发表于 2009-7-7 17:12:55

楼上的上当了,呵呵

hxwilliam 发表于 2009-8-24 17:35:32

谢谢 初有所学 照你的方法我的问题已经解决了
页: [1]
查看完整版本: 帮我看看这个网采集分页怎么设置啊?