火车采集器软件交流官方论坛

 找回密码
 加入会员
搜索
火车采集器V9版免费下载火车浏览器 - 可视采集,万能群发,全自动脚本工具
查看: 3656|回复: 2

采集区域的定界符,希望能支持HTML标签配对。这样就简单多了。

[复制链接]
发表于 2011-11-11 07:28:09 | 显示全部楼层 |阅读模式
很多文本编辑器都可以显示配对标签的区域。
html中的标签,如果仅仅按照标签名字配对的话,重复的太多了,<td>  <tr> <div>这样的。如果设置定界符的时候,支持自动配对标签,那么设定起来就简单方便多了。

比如,我想采集 <div class="t_fsz">…………</div>这两个标签中间的内容,<div class="t_fsz">这个标签在源码中是唯一的,但是合同配对的</div>就太多了,有时候很难定界。即便你定界了,但是很可能会多一个或少一个div tr td ,造成发布出来的效果穿帮。

所以,如果真的能用配对的原理定界最后一个</div>的话,那么写规则的时间至少能节省80%。
发表于 2012-1-12 23:35:01 | 显示全部楼层
如果在html代码规范的情况下,可使用xpath方式提取更简单,v7版本有这个功能
发表于 2016-2-8 15:32:18 | 显示全部楼层
历史帖子回顾中。
您需要登录后才可以回帖 登录 | 加入会员

本版积分规则

QQ|手机版|Archiver|火车采集器官方站 ( 皖ICP备06000549 )

GMT+8, 2026-3-31 07:06

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表