RMB悬赏采集网址问题,搜索结果列表页第一页、第二页的网页地址无规律可循2-n页是等差
本帖最后由 xywl_sk 于 2012-10-7 11:21 编辑如题:
搜索结果第一页http://www.***.com/sch/i.html?***=45&_ipg=50&rt=nc
第二页http://www.***.com/sch/i.html?***=45&_pgn=2&_skc=50&rt=nc
第三页http://www.***.com/sch/i.html?***=45&_pgn=3&_skc=100&rt=nc
第二、三页的红色部分,第一页都没有,没法设置等差:(:(
现金悬赏,请高手们教下小弟这个要怎么设置网址采集?本人刚学火车头几天,请多多指点。先谢过:hug:
这个参数值 你使用固定的试试 看下用50或者100访问到的页面是一样的不如果是一样的 那么这个参数用固定即可 可以不管 侠女,不行啊 如果用固定的值50或者100 显示的还是第二和第三页的内容,这个参数一定要变的
像这种分页地址里面有两个等差的要怎么采地址啊?还请侠女帮帮我这个新手 那就弄个插件采集了 303718 发表于 2012-10-8 20:20 static/image/common/back.gif
那就弄个插件采集了
我现在在尝试添加第一页的地址然后选定分页列表的区域让它自动分页,不过这个好像要对HTML语言很了解才能采到分页,不知道这样行不行? 如果有列表显示出来。这样也会行的。 流浪侠女 发表于 2012-10-8 09:35 static/image/common/back.gif
这个参数值 你使用固定的试试 看下用50或者100访问到的页面是一样的不如果是一样的 那么这个参数用固 ...
侠女,我现在在尝试添加第一页的地址然后选定分页列表的区域让它自动分页,这种方法有没有什么注意事项啊?我试了下好像页数采不全,都是循环前面几页,好苦恼 303718 发表于 2012-10-9 10:17 static/image/common/back.gif
如果有列表显示出来。这样也会行的。
问题是要让火车自动分页的规则我写不好 我给火车定义了采集分页地址链接的区域,火车采出来的分页是循环的链接地址有7个,火车取了8个,但是前4个循环了两次。我定义的列表区域里面只有7个链接,火车不知怎么取出来还循环。。。。。。。郁闷
页:
[1]