发新话题
打印

火车头疑问?

火车头疑问?

如果,我在内容匹配的开始里写一个正则,结束里写一个正则
火车头的机理是不是找出,开始匹配的index,和结束匹配到了index,然后取这两个index之间的内容,


我刚才写的一个开始和结束的正则,可是测试匹配的时候,不是我要的内容,,但是我用正则测试工具测试开始和结束的index都是对的

http://oldhouse.fdc.com.cn/oldhouse_display.asp?id=2456010这个地址

开始字符串:正则:height="26"></td>[\S\s]+?</tr>[\S\s]+?(</table>)[\s\S]+?<table[\S\s]+?房屋编号[\S\s]+?联系电
结束字符串:正则:联系电话</td>[\S\s]+?</table>[\S\s]+?(<table) width="100%"

请各位高手告诉,我是怎么回事!~~~~~谢谢!!!!

[ 本帖最后由 petshop 于 2007-5-17 18:06 编辑 ]

TOP

下个版本会支持标准的正则表达式给专业人员使用。
火车采集器VIP,论坛大挪移VIP,模块以及规则定制,免费模块规则和采集录像教程请进

TOP

目前的版本你不要用这个正则式
火车采集器VIP,论坛大挪移VIP,模块以及规则定制,免费模块规则和采集录像教程请进

TOP

那有什么好的办法刚好匹配我要的部分表格咧?

TOP

请指教,然到要一个字段一个字段的取,然后写模板把信息发进去?

TOP

那么这个版本的正则,是用来干什么的?
下个版本什么时候出来呀?

TOP

还有,就是排除和替换。

是先排除和替换再采集,还是先采集再替换。

我觉得这两种应该可以选。

TOP

发新话题
Powered by Discuz! 6.0.0  © 2001-2007 Comsenz Technology Ltd
Processed in 0.273913 second(s), 6 queries, Gzip enabled
当前时区 GMT+8, 现在时间是 2008-12-5 17:07 皖ICP备06000549 清除 Cookies - 联系我们 - 火车采集器官方站 - 静态归档