采集篱笆网的分页碰到问题!
采集篱笆论坛的分页碰到问题,主要是它用js设置了一个baseurl,导致分页识别不出!document.write("<base href="+urlTerms+"/>");
测试页面http://bbs.sh.liba.com/t_55_2210226_1.htm
截图说明: 哪位大大能帮忙解决一下?
另外用手动分页一直没弄明白! 已解决!
分享一下吧,火车头的手动分页那里说明不对,我开始用的是在线帮助中的方法:
对符合分页连接地址样式的网址,都替换转换为[分页网址]中定义的格式,生成分页地址加入采集
如:分页链接地址格式为<a href="/php/article_[文章分页编号].html"
分页网址为http://new.locoy.com/php/article_[文章分页编号].html
但是完全不起作用,后来搜索了论坛,用以下方法解决!
样式:<a href="t_[参数].htm">
分页地址:http://bbs.sh.liba.com/t_[参数1].htm
结果正常!
页:
[1]