|
楼主 |
发表于 2013-8-21 14:06:41
|
显示全部楼层
接下来以实例说明:
A-Z 26个栏目,每个栏目下有一定数量页面(彼此不同)如下:- www.baidu.com/A/index_1.html
- www.baidu.com/A/index_2.html
- www.baidu.com/A/index_3.html
- www.baidu.com/A/index_4.html
- www.baidu.com/B/index_1.html
- www.baidu.com/B/index_2.html
- www.baidu.com/C/index_1.html
- www.baidu.com/D/index_1.html
- www.baidu.com/D/index_2.html
- www.baidu.com/D/index_3.html
复制代码 假定任意栏目最大页数为90页(实际栏目页数可能在20、40等等)
编写规则如下:- http://www.xindm.cn/letter/{0<a,A,Z,false>}/index_{1<0,2,90,1,false,false>}.html
复制代码 执行“测试采集网址”,一切正常,在结束后会提示 XX区域为空等等。
——————————BUG分割线————————————
保存任务,勾选采集等等,然后运行!
直接提示:“第1级获取网址时出错:获取网址区域设置有误,获取的代码内容为空” |
|