请问如何忽略【纯表情】【灌水】楼层的采集
谁能指导下思路?如果我采集一个论坛,某贴中
回复里有的直接就是【两个表情如:ali83ls ali83ls】
或者就是【顶一下】
上面这两种完全无意义的回帖,我能在采集某贴子的时候忽略采集这些楼层吗?
我设置了过滤规则,屏蔽这些表情,但是在发布后,该楼就变成空白了。
请问有办法在采集的时候,就过滤掉这些楼层吗?求思路,谢谢。 如果实在过滤不了你可以弄个插件就可以把这些排除掉了 如果实在过滤不了你可以弄个插件就可以把这些排除掉了
303718 发表于 2011-7-13 15:11 http://bbs.locoy.com/images/common/back.gif
还得自己开发个插件啊? 还得自己开发个插件啊?
koo233 发表于 2011-7-13 17:43 http://bbs.locoy.com/images/common/back.gif
直接过滤图片代码即可 无需开发插件 直接过滤图片代码即可 无需开发插件
专业收费采集 发表于 2011-7-13 17:50 http://bbs.locoy.com/images/common/back.gif
他的意思是直接过滤这种图片地址 把代码写在采集规则里面 他的意思是直接过滤这种图片地址 把代码写在采集规则里面
kang3bao 发表于 2011-7-15 20:24 http://bbs.locoy.com/images/common/back.gif
直接过滤代码以后,这个楼层还是循环采集了的。在发布时候,就会变成空白内容楼层
我是想,连这个空白楼层都不显示。 长度小于多少的时候跳过
貌似现在只能采集到内容长度小于多少不能精确到某一楼 回复 7# caopeiwei
请问这个长度限制 在哪里弄呢?我在内容标签里找不到的
页:
[1]