搞了N天都没搞定的问题,巨难的差别采集
本帖最后由 ninefox 于 2009-6-6 23:46 编辑因要说明问题,写的有点长,还望见谅!!!
例句如下:
<TD width=190>2009年/6月/1日/16点 始发</TD>
<TD width=190>2009年/6月/1日/晚点30分钟</TD>
<TD width=190>2009年/6月/1日/22点/30分 始发</TD>
数据库里字段都是制定好的,是无法改变的,字段如下:
年: year
月: month
日: day
时: hour
分: minute
信息: info
采集的标签设置和字段是相同的,其中的年月日用正则能成功获取,但后面的内容,因为差别太大,所以不晓得如何写规则
详细说明:
如第一句,“2009年/6月/1日/16点 始发”,因为没有“分”,所以要把“分”这个标签的值设为“00”
第二句, “2009年/6月/1日/晚点30分钟”,这里面没有“时”和“分”,所以要把这两个标签的值都设为“00”
第三句,“2009年/6月/1日/22点/30分 始发”,这些就是全部采集了
不知道我说的清楚不,哪位路过的神仙解决过这种情况,还望不吝赐教,拜谢……………… 不会,帮顶。。。
页:
[1]