caifanzi 发表于 2011-11-11 07:28:09

采集区域的定界符,希望能支持HTML标签配对。这样就简单多了。

很多文本编辑器都可以显示配对标签的区域。
html中的标签,如果仅仅按照标签名字配对的话,重复的太多了,<td><tr> <div>这样的。如果设置定界符的时候,支持自动配对标签,那么设定起来就简单方便多了。

比如,我想采集 <div class="t_fsz">…………</div>这两个标签中间的内容,<div class="t_fsz">这个标签在源码中是唯一的,但是合同配对的</div>就太多了,有时候很难定界。即便你定界了,但是很可能会多一个或少一个div tr td ,造成发布出来的效果穿帮。

所以,如果真的能用配对的原理定界最后一个</div>的话,那么写规则的时间至少能节省80%。

caziyo 发表于 2012-1-12 23:35:01

如果在html代码规范的情况下,可使用xpath方式提取更简单,v7版本有这个功能

lbjyuer 发表于 2016-2-8 15:32:18

历史帖子回顾中。
页: [1]
查看完整版本: 采集区域的定界符,希望能支持HTML标签配对。这样就简单多了。