火车采集器软件交流官方论坛

 找回密码
 加入会员
搜索

推荐板块

编辑推荐

求助mymps1.6采集规则

200元 A5中介交易 或者 支付宝中介 谢绝直接付款 发布模块 规则 图片识别 58 赶集 同城 随便那个都可以 在线等 qq:196280180...

规则模块插件资源区|zengyuyu|2012-11-25 20:07

0/3141

2012-11-25

收淘宝店铺网址,要所有的。有的速度联系QQ837638887有的速度联系[qq]837638887[/qq]

收淘宝店铺网址,要所有的。有的速度联系QQ837638887有的速度联系[qq]837638887[/qq]

采集器基础使用讨论区|xinzhilu|2012-11-25 16:02

3/1259

2012-11-25

抓取的数据校验规则 - 新手火车“司机”求助

昨天扒的数据里面发现有些明显的错误(404错误,目标网站反扒加入的胡乱的内容),其实这些数据在收集的时候都可以明显判断(例如某个标签的数据为空),不知道火车头能否...

采集器基础使用讨论区|yang.y.xu|2012-11-25 10:34

2/1586

2012-11-25

多级网址获取,获取的网址在放入任务的网址库前校验吗?

发现个很有趣的现象,估计是目标网站设置了同一IP超短时间内访问同一网址两次将判定为机器爬虫,因此在使用多级网址获取的时候,我很怀疑火车采集器先解析网址,然后校验解...

采集器基础使用讨论区|yang.y.xu|2012-11-24 22:57

0/1988

2012-11-24

探测文件真实地址没反映,可是探测并下载正常为什么?

探测文件真实地址不下载没反映探测失败,可是探测并下载正常为什么? http://www.xxxx.com/do/download.php?i=52-3655 这样的地址

商业用户特别交流服务区|zhenai1973|2012-11-22 17:37

2/39

2012-11-24

火车头不能采集js加载的内容

比如说,淘宝的宝贝描述详细内容

采集器基础使用讨论区|乐天无极|2012-11-06 08:16

3/12727

2012-11-24

WEB测试成功,点发布以后只显示数量,没有内容

请问, WEB测试发布成功,到论坛看标题内容什么的都正常。 在在线WEB发布配置 里的 测试发布 显示 参数错误 标题 内容 这是什么原因,而且采集发布 显示的都 是...

采集器基础使用讨论区|disk0|2012-11-24 15:44

3/1919

2012-11-24

付费求高手解决采集问题

最近采集的一个数据库有很多限制,是通过就COOKIN和访问频率,IP来限制采集的,每次只能采集一点就没法继续采了,有采集过类似站点的哥们请给予帮助,愿付酬劳费,我QQ:310...

商业用户特别交流服务区|starlunwen|2012-11-23 21:12

2/38

2012-11-24

有办法自动采集目标论坛的新回复,然后发布到我论坛上吗?

有办法自动采集目标论坛的新回复,然后发布到我论坛上吗?

商业用户特别交流服务区|caopeiwei|2012-11-24 13:36

0/26

2012-11-24

请教个关于纯正则替换的问题

请教个关于纯正则替换的问题。 原表达式如下: 替换后的表达式\1 请问我在替换后的表达式里想调用原表达式里捕获的内容可以么? 我只是举个例子我想要替换的内容比较复杂,...

采集器基础使用讨论区|tb51cx|2012-11-23 12:53

2/3671

2012-11-24

关于采集后FTP上传问题

1.火车头在发布运行后,软件没下载完成的没办法上传到FTP上去,只有下载完成在能上传,(应该怎么设置让一些没下载完成的,等下载继续上传) 2、FTP上传上去,软件名称为中...

商业用户特别交流服务区|hdy545|2012-11-16 11:50

3/46

2012-11-24

请问火车头有加密功能吗,就是软件不要别人使用那种

请问火车头软件能加密使用吗, 就是我采集的内容,采集的规则,都加密,不让别人看到那种。

采集器基础使用讨论区|lqyromeo|2012-11-24 10:29

1/2985

2012-11-24

【BUG】百姓网等网站采集一个栏目要采集3-4次甚至更多才能采集完整?速度设置过了

BUG报告|caijihome|2012-11-14 18:18

4/4500

2012-11-24

求助采集网址

首页 www.xxxx.com 二级 www.xxxx.com/bool/7502 三级分页是www.xxxx.com/bool/7502/XXX.html 但是源码里面不是完整的链接,只有 XXX.html 请问那个完整地址应该怎么写?...

采集器基础使用讨论区|5180420|2012-11-23 20:32

5/2189

2012-11-24

SQLLITE快 还是SQL 快

这几个选项 请用过的人给个建议 哪个更能提高速度呢/>

采集器基础使用讨论区|463902|2012-11-23 18:04

4/2163

2012-11-24

图片地址没有后缀如何采集并保存

采集页面:http://dianying.fm/=silent-hill-2 图片地址:http://dianying.fm/poster/l/5071c72c90d7a90a4169e499 问题:图片地址没有后缀名,不知道如何下载或者提取到图...

采集器基础使用讨论区|whitebaby|2012-11-23 20:49

1/2728

2012-11-23

dz 下载的图片上传到哪个目录

dz 下载的图片上传到哪个目录

采集器基础使用讨论区|pllocn|2012-11-23 19:04

3/5142

2012-11-23

官方采集下载的图片 附加要怎么上传?

官方采集下载的图片 附加要怎么上传? 有没有人知道 谢谢

Discuz! | & Supsite|pllocn|2012-11-23 20:09

1/3476

2012-11-23

建议

火车头 弄个批量设置就好了 写了200多个规则 最后发现有需要屏蔽的网子 又得回头一一增加累死人

扩展开发|shunshunshun|2012-11-23 20:30

1/2234

2012-11-23

求助-火车头加后缀怎么让他不在分页。。。

求助-火车头加后缀怎么让他不在分页加后缀而在全文加后缀。 如图:分页1 分页末尾

采集器基础使用讨论区|mykes|2012-11-22 18:07

2/3138

2012-11-23

企业微信|手机版|Archiver|火车采集器官方站 ( 皖ICP备06000549 )

GMT+8, 2026-5-4 10:44

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

返回顶部