火车采集器软件交流官方论坛

 找回密码
 加入会员
搜索
火车采集器V9版免费下载火车浏览器 - 可视采集,万能群发,全自动脚本工具
查看: 1810|回复: 1

搞了N天都没搞定的问题,巨难的差别采集

[复制链接]
发表于 2009-6-6 23:35:29 | 显示全部楼层 |阅读模式
本帖最后由 ninefox 于 2009-6-6 23:46 编辑

因要说明问题,写的有点长,还望见谅!!!

例句如下:

<TD width=190>2009年/6月/1日/16点 始发</TD>

<TD width=190>2009年/6月/1日/晚点30分钟</TD>

<TD width=190>2009年/6月/1日/22点/30分 始发</TD>

数据库里字段都是制定好的,是无法改变的,字段如下:
年:    year
月:    month
日:    day
时:    hour
分:    minute
信息: info

采集的标签设置和字段是相同的,其中的年月日用正则能成功获取,但后面的内容,因为差别太大,所以不晓得如何写规则

详细说明:

如第一句,“2009年/6月/1日/16点 始发”,因为没有“分”,所以要把“分”这个标签的值设为“00”

第二句, “2009年/6月/1日/晚点30分钟”,这里面没有“时”和“分”,所以要把这两个标签的值都设为“00”

第三句,“2009年/6月/1日/22点/30分 始发”,这些就是全部采集了

不知道我说的清楚不,哪位路过的神仙解决过这种情况,还望不吝赐教,拜谢………………
发表于 2009-6-6 23:59:11 | 显示全部楼层
不会,帮顶。。。
您需要登录后才可以回帖 登录 | 加入会员

本版积分规则

QQ|手机版|Archiver|火车采集器官方站 ( 皖ICP备06000549 )

GMT+8, 2025-7-15 15:35

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表