pengxiaobo 发表于 2008-11-15 11:02:45

采集不完整,急求帮助

http://www.search.hc360.com/cgi-bin/ls,------y3z5fnn74i-0-1------0--1----0---4-x624h56lxe-----1----.html这个是86个分页
http://www.search.hc360.com/cgi-bin/ls,------y3z5fnn74i-0-这个位置是变化的地方间隔为24----0--1----0---4-x624h56lxe-----1----.html
如下
http://www.search.hc360.com/cgi-bin/ls,------y3z5fnn74i-0-25------0--1----0---4-x624h56lxe-----1----.html
http://www.search.hc360.com/cgi-bin/ls,------y3z5fnn74i-0-49------0--1----0---4-x624h56lxe-----1----.html
http://www.search.hc360.com/cgi-bin/ls,------y3z5fnn74i-0-73------0--1----0---4-x624h56lxe-----1----.html
http://www.search.hc360.com/cgi-bin/ls,------y3z5fnn74i-0-95------0--1----0---4-x624h56lxe-----1----.html
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
http://www.search.hc360.com/cgi-bin/ls,------y3z5fnn74i-0-2041--0--1----0---4-x624h56lxe-----1----.html就是86的一页
总共是2063条信息。为什么只采集1008条呢。我规则检查过了,都没问题,
我写的批量如图。

请高手指点指点,谢谢

rq204 发表于 2008-11-15 11:29:19

你测试网址时请看下有多少网址

lovebaidu 发表于 2008-11-15 11:33:14

看一下页数对吗。差了这么多,肯定有错误的。

pengxiaobo 发表于 2008-11-15 17:00:53

回复 2楼 的帖子

应该是2063条。我测试是出来也是2063,我都郁闷个了,采集就采集不全

pengxiaobo 发表于 2008-11-15 17:02:40

回复 3楼 的帖子

分页是86页但在网址显示的是间隔为24的,是1过了下一页是25再下一页是49
页: [1]
查看完整版本: 采集不完整,急求帮助