hutouzhengba 发表于 2010-9-10 09:28:54

采集分页问题

使用火车头采集文章时,要采集的文章有15页。火车头有两种采集方式:全部列出模式、上下页模式。
使用“全部列出模式”只能采集到文章的前11页(包括第11页);使用“上下页模式”采集的页数比原文章多1页,多采的1页的内容是第一页的内容。
      请问这个是什么原因引起的???
      我使用地址排除,排除第一页,但是没有效果!!!

       请问应该怎么解决这个问题呢?????????
       请指教!!!

zjyk1984 发表于 2010-9-10 11:01:17

不知道你怎么设置的,可以贴图来看看,正常应该不会有重复的

hutouzhengba 发表于 2010-9-10 14:20:56

很抱歉,我只能描述,没办法截图出来。
原文章的分页形式:<<   上一页     下一页   >>
<<和>>也是链接,分别指向上一页、下一页,和“上一页”、“下一页”指向的是同一个链接地址。
您看看能不能给举个例子说明一下这样的应该怎么采集呢??

hutouzhengba 发表于 2010-9-10 16:51:20


这是我画的一个简易的药采集的文章的样子。请帮忙看看啊!!
点<<可以回到第5页并显示前5页的页号;
点 >> 可以回到第6页并显示后面的5个页的页号。

请问各位应该怎么采集啊??
我采的总是多一页!!!!
请求帮助啊!!!


采集多一页的问题请问是我本身规则的问题,还是说是软件本身的bug。请求恢复!!!

ZLT168 发表于 2011-2-14 22:43:15

我也正在为这个问题犯愁,有高手解答下吗?

reallovelei 发表于 2011-3-8 17:35:43

同样的症状, 没有人回答啊!~郁闷
页: [1]
查看完整版本: 采集分页问题