火车采集器软件交流官方论坛

 找回密码
 加入会员
搜索
火车采集器V9版免费下载火车浏览器 - 可视采集,万能群发,全自动脚本工具
查看: 2045|回复: 5

我现在一个需求,不知道能否方便的满足?

[复制链接]
发表于 2009-5-12 12:50:30 | 显示全部楼层 |阅读模式
采集目标:
采集目标是一系列,多站点论坛的帖子列表。这些帖子可能是discuz或者phpwind, 并且版本号不一致,例如:
http://www.discuz.net/thread-4324124.html      discuz7.0
http://www.discuz1.net/thread-4324124.html     discuz6.0
http://www.phpwind.net/thread-4324124.html     phpwind5.0
http://www.phpwind1.net/thread-4324124.html    phpwind4.0
只需要采集这些帖子一楼的内容,并且存放到数据库中,供其他程序调用、展现
不知道火车头能否比较方便的实现这个功能, 如果需要二次开发,能否大概说明一下处理思路? 烦请管理员回复一下
发表于 2009-5-12 13:20:28 | 显示全部楼层
针对不同站点你可以使用不同的规则来采集,采集完的数据你想怎么处理都可以
 楼主| 发表于 2009-5-12 16:45:14 | 显示全部楼层
问题是,能否自动实现选取采集规则?
比如,我已经知道了以下帖子列表
http://www.discuz.net/thread-4324124.html      
http://www.discuz1.net/thread-4324124.html     
http://www.phpwind.net/thread-4324124.html     
http://www.phpwind1.net/thread-4324124.html   

在手工处理的情况, 针对不同的url,确实可以使用不同的采集规则,但是,在自动处理的情况下,能否自动根据url选取不同的采集规则? 这个是否需要二次开发? 这个很关键,如果需要手工处理,那工作量就大了
 楼主| 发表于 2009-5-12 22:12:22 | 显示全部楼层
烦请管理员再回复一下
发表于 2009-5-12 22:17:54 | 显示全部楼层
火车头应该可以处理
但是不会免费
发表于 2009-5-13 23:43:42 | 显示全部楼层
应该是这样:

1. 每个任务只能针对一个站点下的某个板块
2. 多个站点,如果规则相同,你必须通过不同的规则。当然,你也可以用二级深度采集。在最上面那个框中,将几个网址都填入进去。前提是必须找到共同的采网址和采内容规则。
3. 你可以通过复制任务的方式添加多个任务,然后修改一下目标网址即可。
您需要登录后才可以回帖 登录 | 加入会员

本版积分规则

企业微信|手机版|Archiver|火车采集器官方站 ( 皖ICP备06000549 )

GMT+8, 2026-4-26 15:47

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表