火车采集器“手动填写链接地址规则”模块漏洞
本帖最后由 b2bsharing 于 2009-5-11 15:24 编辑从上图可以看到,我设置了“不得包含”规则,但是却没有生效!
经过测试,此时“必须包含规则”则可以生效 图片看不到 2# rq204
现在可以看到了吗? 规则帖一下 .要转义掉
不得包含
74\.6\.146\.127 呵呵 学习了 有的时候确实会忘记转义 这里是正则过滤,正则元字符需要用反斜线转义才表示真正的符号. 本帖最后由 b2bsharing 于 2009-5-11 15:25 编辑
转义的试过了,还是不行,这个是我的规则 本帖最后由 sushy 于 2009-5-14 12:55 编辑
我注意到:
网页上的原始链接是http://search.yahoo.com/preferences/preferences;_ylt=A0oGkjEynwtKQq4ALW9XNyoA?page=search_assist&pref_done=http%3A%2F%2Fsearch.yahoo.com%2Fsearch%3Fei%3DUTF-8%26p%3Dlink%253Ahttp%253A%252F%252Fwww.uggaustralia.com%2B-www.uggaustralia.com%26b%3D10%26fp_ip%3DCN&.bcrumb=f6VDmBToDEn
鼠标放上去以后任务栏显示的连接是
http://www.digital-librarian.com/shopping.html
但鼠标右键快捷方式复制出来的连接又与第一个相同。
不清楚yahoo是怎么个机制,大概是用了js控制吧。而火车采集出来的内容并不是文本内容,而是和鼠标放在链接上出现的内容相同。
另外对于其他页面没有问题的过滤规则,为什么到这里就不能用了,我也是很奇怪。 楼主用这个规则即可
页:
[1]
2