采集区域的定界符,希望能支持HTML标签配对。这样就简单多了。
很多文本编辑器都可以显示配对标签的区域。html中的标签,如果仅仅按照标签名字配对的话,重复的太多了,<td><tr> <div>这样的。如果设置定界符的时候,支持自动配对标签,那么设定起来就简单方便多了。
比如,我想采集 <div class="t_fsz">…………</div>这两个标签中间的内容,<div class="t_fsz">这个标签在源码中是唯一的,但是合同配对的</div>就太多了,有时候很难定界。即便你定界了,但是很可能会多一个或少一个div tr td ,造成发布出来的效果穿帮。
所以,如果真的能用配对的原理定界最后一个</div>的话,那么写规则的时间至少能节省80%。 如果在html代码规范的情况下,可使用xpath方式提取更简单,v7版本有这个功能 历史帖子回顾中。
页:
[1]