哪位有discuz 6静态的采集规则?
瞄上了一个站,是用discuz 6静态的论坛,我想采集他们的内容,可是找了半天没找到有规则下载,请问哪位提供一下帮助吧? 我也要` 顶一个! 给你个思路,其实很容易,discuz 6采集其实并不难,只是伪静态的原因,容易采集到重复的内容:(
可以考虑采集archiver目录(缺点:没图)
或者如果目标站点已经是伪静态,就通过规则,采集他的参数,加到非伪静态的访问路径上,还原为动态调用的路径
这样也是可以采集到唯一
需要注意的是:
1。防采集的干扰码记得过滤
2.如果发布站不是论坛,记得转换代码形式
其他一时想不起来
页:
[1]