采集分页的时候。原文的第一页总是会重复呢?
本帖最后由 梦溪笔谈 于 2009-4-22 17:07 编辑我在采集分页的时候,为什么分页内容的第一个页面总是会重复出现?
例如,我现在要采集一条含有分页的资讯,在采集测试并发布的时候,总会出现“第一个页面出现两次,然后再出现第二个页面”的状况,请问这是为什么?
更奇怪的是为什么有的分页采集就能完全正确的采集完整,而有的就不行就会出现上述的状况?我仔细的比较过它们的配置设置,都是一样的。可最终的差距怎么就那么大(⊙o⊙)? 分页规则没有设置好,你把地址贴出来 我帮你看看. 本帖最后由 dyg2008 于 2009-5-8 15:00 编辑
我也出现这样的问题,不知道怎么解决?
http://dyg2008.512j.com/article/sort.php/2里的下级连接:http://dyg2008.512j.com/article/article.php/403就有分页,有些文章有分页又有些文章没有分页,
分页可以识别:http://dyg2008.512j.com/article/article.php/403/1
http://dyg2008.512j.com/article/article.php/403/2
http://dyg2008.512j.com/article/article.php/403/3
http://dyg2008.512j.com/article/article.php/403/4
这样采集后http://dyg2008.512j.com/article/article.php/403/1和http://dyg2008.512j.com/article/article.php/403就重复了
不知道怎么设置有分页就不采/1,而只采/2,/3 ,/4
而且发布的时候就只有第一页,怎么回事?后面几页 怎么不发布呀?
页:
[1]