火车采集器软件交流官方论坛

 找回密码
 加入会员
搜索
火车采集器V9版免费下载火车浏览器 - 可视采集,万能群发,全自动脚本工具
查看: 1753|回复: 1

这种规则为什么会是这种结果

[复制链接]
发表于 2012-11-27 11:59:24 | 显示全部楼层 |阅读模式
代码:
<div id=“aaa”>开始标签
<p>内容</P>
<div>一小段内容</div>
<p>内容</P>
</div>
<div class="arc_next">

过滤规则:

开始:<div id=“aaa”>
结尾:</div>(*)<div class="arc_next">

描述:
我一般采集一边文章,希望的是不多任何一个html代码,所以有些时候规则确实设置得有点儿复杂
意图:如果我直接用</div>作为结尾肯定不行,因为有的文章里面可能带了div标签所以这样不行
如果我直接用<div class="arc_next">这恐怕也不行,因为内容一般都是在div标签内,
我们以<div>为开始的,直接用<div class="arc_next">那么就多了一个</div>标签。
而且
</div>
   <div class="arc_next">
很明显里面有空格,所以我就把规则设置为:

</div>(*)<div class="arc_next">

问题:
他丫的
</div>
<p>内容</P>
</div>
<div class="arc_next">
是截取的第一个</div>前面的内容,求高手解救

发表于 2012-11-27 17:15:55 | 显示全部楼层
你开始改成这样
  1. <div id=“aaa”>(*)</div>
复制代码
您需要登录后才可以回帖 登录 | 加入会员

本版积分规则

QQ|手机版|Archiver|火车采集器官方站 ( 皖ICP备06000549 )

GMT+8, 2025-8-13 11:52

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表