hutouzhengba 发表于 2010-9-9 11:05:45

火车头屏蔽js问题

在采集的文章里面包含了一部分javascript代码,请问怎么屏蔽掉这些代码??
在内容采集规则中看到了“屏蔽<script”标签,这个是没问题的,但是文章中还包含了onclick、onmouseover等等之类的代码,请问该怎么屏蔽掉这些代码,我设置了:排除on(*)='(*)',但是这样会屏蔽掉其他有用的代码(如:<font size='3'>文字</font>)。
请问,有什么办法可以屏蔽掉着部分代码??????
请指教!!谢谢!!!

专业收费采集 发表于 2010-9-9 11:24:32

<script (*)>(*)</script>

这样写下不就可以了


有需要找我 Q 1391828939

hutouzhengba 发表于 2010-9-9 13:36:27

你这样写的话只能屏蔽掉以<script开头和结尾的内容,但是没有这个标签的怎么屏蔽掉呢??
<fontonclick="tt();">文字</font>   像这样的内容中,onclick事件调用的是tt方法,tt方法是js中自己写的方法,那么怎么才能把onclick="tt();"这部分给屏蔽掉呢??就是说怎么样在内容中不显示这部分代码。js中有很多类似于onclick这样的事件,总不能一个一个的排除吧!!!
请指教!!!!
页: [1]
查看完整版本: 火车头屏蔽js问题