帮我看看这个网采集分页怎么设置啊?
http://www.lunwennet.com/thesis/2008/21362.html上边是网址
我按照教程那样不管怎么设 分页采集都不成功... 这个是比较简易的,可能是设置的时候出错。
过程:
1.设置编码为gb2312,内容标签的开始字符串为<TD style="TABLE-LAYOUT(*)>,结束字符串为<p align='center'>。
2.设置分页区域,点选“全部列出模式”。
3.因为源代码中分页区的字符串为
<p align='center'><b><font color='red'></font> <a href='/thesis/2008/21362_2.html'></a> <a href='/thesis/2008/21362_2.html'>下一页</a> </b></p><SPAN id=ad3></SPAN></TD>
所以,
“从”填写:<p align='center'>
“到”填写:</p>
点选“自动识别分页”,“分页内容合并连接代码”可以填写“<br><br>”。经过测试可以采集到这2页内容。 你有火车车厢0 节,不知怎么支付车厢 楼上的上当了,呵呵 谢谢 初有所学 照你的方法我的问题已经解决了
页:
[1]