循环采集中,小于x字节放弃采集
请问,循环采集中,怎样放弃某个字节小于N的循环?比如说一个论坛帖子,在3楼有个回帖只有一个字“顶”。
我采集时候,想过滤这个三楼的,应该怎么做呢?
或者能说说插件怎么实现这点吗?
我看示范插件里面,没有教怎么写这样的插件的。 c#插件中是通过 ht["XXX"]获取采集标签值的,其中XXX是第二步内容采集添加的标签名,论坛主题与回复内容循环采集的间隔符是|||,可以根据这个分隔符切割成一个数组,循环遍历下,不满足需求的可以移除掉,然后再用|||链接起来
页:
[1]