zhuhaisto 发表于 2012-11-27 11:59:24

这种规则为什么会是这种结果

代码:
<div id=“aaa”>开始标签
<p>内容</P>
<div>一小段内容</div>
<p>内容</P>
</div>
<div class="arc_next">

过滤规则:

开始:<div id=“aaa”>
结尾:</div>(*)<div class="arc_next">

描述:
我一般采集一边文章,希望的是不多任何一个html代码,所以有些时候规则确实设置得有点儿复杂
意图:如果我直接用</div>作为结尾肯定不行,因为有的文章里面可能带了div标签所以这样不行
如果我直接用<div class="arc_next">这恐怕也不行,因为内容一般都是在div标签内,
我们以<div>为开始的,直接用<div class="arc_next">那么就多了一个</div>标签。
而且
</div>
   <div class="arc_next">
很明显里面有空格,所以我就把规则设置为:

</div>(*)<div class="arc_next">

问题:
他丫的
</div>
<p>内容</P>
</div>
<div class="arc_next">
是截取的第一个</div>前面的内容,求高手解救

303718 发表于 2012-11-27 17:15:55

你开始改成这样<div id=“aaa”>(*)</div>
页: [1]
查看完整版本: 这种规则为什么会是这种结果