legasi 发表于 2011-12-30 20:01:40

采集页面内容地址不得包含已设置,可还是采集下来!

采集页面内容地址不得包含已设置,可还是采集下来!
采集内容目标地址:http://www.jxgxzk.com/gaokao/
典型页面http://www.jxgxzk.com/gaokao/010101/
采集页面内容地址不得包含college.html    即http://www.jxgxzk.com/gaokao/010101/college.html
测试采集地址确实不显示college.html 的页面,共650条
可是我点了开始采集之后,就college.html的也采集下来了 共900多,删除了重复的。
请高手指点!本人菜鸟

legasi 发表于 2012-1-1 19:04:57

怎么没有一个人回答啊

legasi 发表于 2012-1-1 19:05:20

跪求啊来人呀   怎么还不来人啊
页: [1]
查看完整版本: 采集页面内容地址不得包含已设置,可还是采集下来!