孤独天空 发表于 2011-8-15 21:37:41

循环采集中,小于x字节放弃采集

请问,循环采集中,怎样放弃某个字节小于N的循环?

比如说一个论坛帖子,在3楼有个回帖只有一个字“顶”。
我采集时候,想过滤这个三楼的,应该怎么做呢?

或者能说说插件怎么实现这点吗?
我看示范插件里面,没有教怎么写这样的插件的。

wxl08 发表于 2011-8-16 10:02:10

c#插件中是通过 ht["XXX"]获取采集标签值的,其中XXX是第二步内容采集添加的标签名,论坛主题与回复内容循环采集的间隔符是|||,可以根据这个分隔符切割成一个数组,循环遍历下,不满足需求的可以移除掉,然后再用|||链接起来
页: [1]
查看完整版本: 循环采集中,小于x字节放弃采集