ninefox 发表于 2009-6-6 23:35:29

搞了N天都没搞定的问题,巨难的差别采集

本帖最后由 ninefox 于 2009-6-6 23:46 编辑

因要说明问题,写的有点长,还望见谅!!!

例句如下:

<TD width=190>2009年/6月/1日/16点 始发</TD>

<TD width=190>2009年/6月/1日/晚点30分钟</TD>

<TD width=190>2009年/6月/1日/22点/30分 始发</TD>

数据库里字段都是制定好的,是无法改变的,字段如下:
年:    year
月:    month
日:    day
时:    hour
分:    minute
信息: info

采集的标签设置和字段是相同的,其中的年月日用正则能成功获取,但后面的内容,因为差别太大,所以不晓得如何写规则

详细说明:

如第一句,“2009年/6月/1日/16点 始发”,因为没有“分”,所以要把“分”这个标签的值设为“00”

第二句, “2009年/6月/1日/晚点30分钟”,这里面没有“时”和“分”,所以要把这两个标签的值都设为“00”

第三句,“2009年/6月/1日/22点/30分 始发”,这些就是全部采集了

不知道我说的清楚不,哪位路过的神仙解决过这种情况,还望不吝赐教,拜谢………………

都市乞丐 发表于 2009-6-6 23:59:11

不会,帮顶。。。
页: [1]
查看完整版本: 搞了N天都没搞定的问题,巨难的差别采集