walkinrains 发表于 2013-10-24 15:34:07

新人求助火车头采集器设置

http://nc.mofcom.gov.cn/channel/gxdj/jghq/jg_list.shtml?requestPage=1&keyword=&startTime=2013-10-23&endTime=2013-10-23&par_craft_index=13075&craft_index=13259
http://nc.mofcom.gov.cn/channel/gxdj/jghq/jg_list.shtml?requestPage=1&keyword=&startTime=2013-10-23&endTime=2013-10-23&par_craft_index=13075&craft_index=8754641

类似这种网址,这里有4个变量,Requestpage是一个等差数列(平均有1~5页),StartTime和EndTime是一个时间变量,13705是固定参数,最后一个13259是一个没有任何规则的随机变量,一共142个(我有表格),请教一下要如何设置网页采集规则才能够把这142个随机变量下2012年到2013年的所有分页都抓到?

无比感谢

沦陷今生 发表于 2013-10-24 16:17:19

设置获取好分页,时间固定好范围应该就可以
页: [1]
查看完整版本: 新人求助火车头采集器设置