火车采集器软件交流官方论坛

 找回密码
 加入会员
搜索
火车采集器V9版免费下载火车浏览器 - 可视采集,万能群发,全自动脚本工具
查看: 2407|回复: 6

如何只采集部分内容

[复制链接]
发表于 2008-10-19 13:22:18 | 显示全部楼层 |阅读模式
例如

http://news.soso.com/n.q?sc=news&pid=n.res.i&ch=n.res.uf&num=20&st=t&w=%22%B4%F3%D1%A7%C9%FA%BC%C6%BB%AE%22&ty=c

这种页面,body内容有”几小时前“,,和日期 08-10-18

我只想采集 日期 08-10-18 的。而”几小时前“的。不想采集。。

如何在body标签中设置?
发表于 2008-10-19 13:32:14 | 显示全部楼层
这是个问题。规则相同,不太好切割,火车没有字符串比较。
 楼主| 发表于 2008-10-19 13:45:48 | 显示全部楼层
例如以下。只需要采集其中一部分(几小时前的。。)。08-10-19日期,和1小时前
1小时前
2小时前
3小时前
4小时前

08-10-19
08-10-18
08-10-17
08-10-16
发表于 2008-10-19 16:00:44 | 显示全部楼层
这种不好采。。。除非去编写程序去辨别应该可以实现。。。
发表于 2008-10-19 16:06:16 | 显示全部楼层
采集了之后在用sql语句编辑.
发表于 2008-10-19 17:37:26 | 显示全部楼层
编程的话就可以过滤掉了。
不知道不用编程的话用正则如何呢?
发表于 2008-10-19 20:09:22 | 显示全部楼层
不太好办,学习以下
您需要登录后才可以回帖 登录 | 加入会员

本版积分规则

QQ|手机版|Archiver|火车采集器官方站 ( 皖ICP备06000549 )

GMT+8, 2025-5-21 09:49

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表