采集分页问题
采集地址:http://www.hxfoods.com/bbs/dispbbs.asp?boardID=20&ID=384945&page=1分页从 images/pagelist/First.gif到 images/pagelist/Last.gif
我怎么采集不到下一页的内容呢? 分页开始区域<img src="images/pagelist/First.gif" border="0" alt="" /> 结束区域<img src="images/pagelist/Last.gif" border="0" alt="尾页" /> 还是不行呢? 顶。。。。 开始:<td class="tabletitle1">
结素:<td class="tablebody1"><input type="text" name="Star" size="1" value="2" class="PageInput" />
我这边没测试 不知道能行不 好像采不了。
可以用多页面采集,采10页就设置10个新标签,10页=100篇回复应该够了。
http://www.hxfoods.com/bbs/dispbbs.asp?boardID=20&ID=384945&page=1
这个网址的实际网址是
http://www.hxfoods.com/bbs/dispbbs.asp?boardid=20&replyid=406260&id=384945&page=1&skin=0&Star=1
第一个新标签页面网址设置把Star=1替换为Star=2,第二个新标签页面网址设置把Star=1替换为Star=3,...... 看不明白 <td class="tablebody1"> <a href="dispbbs.asp?boardid=20&replyid=406260&id=384945&page=1&skin=0&Star=2" target="">2</a> </td>
要用手动分页规则
页:
[1]