b2bsharing 发表于 2009-5-11 10:33:08

火车采集器“手动填写链接地址规则”模块漏洞

本帖最后由 b2bsharing 于 2009-5-11 15:24 编辑





从上图可以看到,我设置了“不得包含”规则,但是却没有生效!

经过测试,此时“必须包含规则”则可以生效

rq204 发表于 2009-5-11 10:40:43

图片看不到

b2bsharing 发表于 2009-5-11 11:23:44

2# rq204
现在可以看到了吗?

rq204 发表于 2009-5-11 12:12:15

规则帖一下

火车头 发表于 2009-5-11 12:14:32

.要转义掉
不得包含
74\.6\.146\.127

专业收费采集 发表于 2009-5-11 13:59:10

呵呵 学习了 有的时候确实会忘记转义

vus520 发表于 2009-5-11 15:18:06

这里是正则过滤,正则元字符需要用反斜线转义才表示真正的符号.

b2bsharing 发表于 2009-5-11 15:18:17

本帖最后由 b2bsharing 于 2009-5-11 15:25 编辑

转义的试过了,还是不行,这个是我的规则

sushy 发表于 2009-5-14 12:53:48

本帖最后由 sushy 于 2009-5-14 12:55 编辑

我注意到:
网页上的原始链接是http://search.yahoo.com/preferences/preferences;_ylt=A0oGkjEynwtKQq4ALW9XNyoA?page=search_assist&pref_done=http%3A%2F%2Fsearch.yahoo.com%2Fsearch%3Fei%3DUTF-8%26p%3Dlink%253Ahttp%253A%252F%252Fwww.uggaustralia.com%2B-www.uggaustralia.com%26b%3D10%26fp_ip%3DCN&.bcrumb=f6VDmBToDEn
鼠标放上去以后任务栏显示的连接是
http://www.digital-librarian.com/shopping.html
但鼠标右键快捷方式复制出来的连接又与第一个相同。

不清楚yahoo是怎么个机制,大概是用了js控制吧。而火车采集出来的内容并不是文本内容,而是和鼠标放在链接上出现的内容相同。

另外对于其他页面没有问题的过滤规则,为什么到这里就不能用了,我也是很奇怪。

沦陷今生 发表于 2009-5-14 13:28:29

楼主用这个规则即可
页: [1] 2
查看完整版本: 火车采集器“手动填写链接地址规则”模块漏洞