火车采集器软件交流官方论坛

 找回密码
 加入会员
搜索
火车采集器V9版免费下载火车浏览器 - 可视采集,万能群发,全自动脚本工具
查看: 5543|回复: 6

火车头疑问?

[复制链接]
发表于 2007-5-17 18:02:51 | 显示全部楼层 |阅读模式
如果,我在内容匹配的开始里写一个正则,结束里写一个正则
火车头的机理是不是找出,开始匹配的index,和结束匹配到了index,然后取这两个index之间的内容,


我刚才写的一个开始和结束的正则,可是测试匹配的时候,不是我要的内容,,但是我用正则测试工具测试开始和结束的index都是对的

http://oldhouse.fdc.com.cn/oldhouse_display.asp?id=2456010这个地址

开始字符串:正则:height="26"></td>[\S\s]+?</tr>[\S\s]+?(</table>)[\s\S]+?<table[\S\s]+?房屋编号[\S\s]+?联系电
结束字符串:正则:联系电话</td>[\S\s]+?</table>[\S\s]+?(<table) width="100%"

请各位高手告诉,我是怎么回事!~~~~~谢谢!!!!

[ 本帖最后由 petshop 于 2007-5-17 18:06 编辑 ]
发表于 2007-5-17 20:26:24 | 显示全部楼层
下个版本会支持标准的正则表达式给专业人员使用。
发表于 2007-5-17 20:28:10 | 显示全部楼层
目前的版本你不要用这个正则式
 楼主| 发表于 2007-5-18 08:09:14 | 显示全部楼层
那有什么好的办法刚好匹配我要的部分表格咧?
 楼主| 发表于 2007-5-18 08:11:50 | 显示全部楼层
请指教,然到要一个字段一个字段的取,然后写模板把信息发进去?
 楼主| 发表于 2007-5-18 08:18:42 | 显示全部楼层
那么这个版本的正则,是用来干什么的?
下个版本什么时候出来呀?
 楼主| 发表于 2007-5-18 08:28:36 | 显示全部楼层
还有,就是排除和替换。

是先排除和替换再采集,还是先采集再替换。

我觉得这两种应该可以选。
您需要登录后才可以回帖 登录 | 加入会员

本版积分规则

QQ|手机版|Archiver|火车采集器官方站 ( 皖ICP备06000549 )

GMT+8, 2024-11-24 22:36

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表