火车采集器软件交流官方论坛

 找回密码
 加入会员
搜索
火车采集器V9版免费下载火车浏览器 - 可视采集,万能群发,全自动脚本工具
查看: 3788|回复: 6

让火车功能更实用,采网址时加个模块判断。支持的顶哦!~

[复制链接]
发表于 2008-4-6 22:49:06 | 显示全部楼层 |阅读模式
1。在采网址时加个判断,比如是精华贴才采集、是推荐贴才采集,标题包含“奥运”才采集。这样采回来的数据就不会是全部一样的,质量也高点。

2。要采网址时加个来路设置,因为有的网站的列表页就只有一个地址,POST内部完成了,估计这个有点难,呵呵。

[ 本帖最后由 idtown888 于 2008-4-6 22:51 编辑 ]
发表于 2008-4-6 23:14:56 | 显示全部楼层
这个比较难实现,估计目前是不会加的。
发表于 2008-4-6 23:21:11 | 显示全部楼层
是的,通过程序自动识别比较难实现,目前是不会加的。

如果楼主有编程基础的话可以通过个人变通的去采集

第一点:使用的正则,匹配关键字采集.或者采集完毕后写程序进行数据过滤,或者使用单独的接口程序.
第二点:通过截取Cookie以及提交Post数据,可以分析出分页信息。
头像被屏蔽
发表于 2008-4-7 00:23:35 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
发表于 2008-4-7 01:12:05 | 显示全部楼层
新版本会考虑加这个功能的~~~
发表于 2008-4-7 01:31:21 | 显示全部楼层
老大发话了..大家期待了
发表于 2016-2-10 08:17:40 | 显示全部楼层
爪,以后学习下。。
您需要登录后才可以回帖 登录 | 加入会员

本版积分规则

QQ|手机版|Archiver|火车采集器官方站 ( 皖ICP备06000549 )

GMT+8, 2024-11-24 18:25

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表