minlab 发表于 2009-5-25 13:33:32

火车头的内容排除功能好象不完善啊

火车头内容排除
(1)只支持把包含内容排除,例:要排除64.233.163.58:80内容,
做个排除规则就可以了
(2)不支持把不包含内容排除,例:要排除不符合76.163.131.46:443内容
就不知道怎么做了.
如果一个内容页面有二三个不符合内容排除.怎么做,汗
有那位大大知道,指教一下,谢
例子

64.233.163.58:8076.163.131.46:443209.85.133.123:8024.232.134.232:8080

rq204 发表于 2009-5-25 14:49:29

不得包含里的默认是不会采集的,已经采不到内容了,替换什么?

minlab 发表于 2009-5-25 21:51:23

楼上意思是不得包含里的默认不采集,但是我是想在采下来的数据里面过滤不符合条件要求的数据.
以下面采集到的IP数据做为例子,我要把没有带@s关健字的IP排除掉,要怎么设置
例子:
70.176.34.208:2633@s5
66.90.251.12:8080
200.55.170.90:1080@s4
65.44.114.134:80
98.24.252.54:31269@s5
71.202.38.94:12165@s5
24.94.49.215:2713@s5
222.220.99.217:1080
页: [1]
查看完整版本: 火车头的内容排除功能好象不完善啊