[求助]怎么采集分类特别细的网站
比如http://www.3edu.net/这个网,分类特别细,从首页到列表至少二级,而且真正能到底层内容的还是底层列表,并且列表又是多个分页怎么在采集地址中能尽量少设网址?
虽然论坛里有一个这个网的采集规则,我还花了一个车厢,但是下载后很失望,采的网址非常少,还不如我一条一条加每个分类列表页面.我自己做了一个批量采集网址规则,但是每一个分类都要手工加上去,效率太慢了,有没有什么好的方法?
另外我还是新手,关于里面[参数] [正则提取]之类还不太懂,有没有高手讲下啊.
呵呵 这是正则,一时半会可能难以理解,
页:
[1]