采集分页问题
使用火车头采集文章时,要采集的文章有15页。火车头有两种采集方式:全部列出模式、上下页模式。使用“全部列出模式”只能采集到文章的前11页(包括第11页);使用“上下页模式”采集的页数比原文章多1页,多采的1页的内容是第一页的内容。
请问这个是什么原因引起的???
我使用地址排除,排除第一页,但是没有效果!!!
请问应该怎么解决这个问题呢?????????
请指教!!! 不知道你怎么设置的,可以贴图来看看,正常应该不会有重复的 很抱歉,我只能描述,没办法截图出来。
原文章的分页形式:<< 上一页 下一页 >>
<<和>>也是链接,分别指向上一页、下一页,和“上一页”、“下一页”指向的是同一个链接地址。
您看看能不能给举个例子说明一下这样的应该怎么采集呢??
这是我画的一个简易的药采集的文章的样子。请帮忙看看啊!!
点<<可以回到第5页并显示前5页的页号;
点 >> 可以回到第6页并显示后面的5个页的页号。
请问各位应该怎么采集啊??
我采的总是多一页!!!!
请求帮助啊!!!
采集多一页的问题请问是我本身规则的问题,还是说是软件本身的bug。请求恢复!!! 我也正在为这个问题犯愁,有高手解答下吗? 同样的症状, 没有人回答啊!~郁闷
页:
[1]