火车采集器软件交流官方论坛

 找回密码
 加入会员
搜索

推荐板块

编辑推荐

建议更改分页识别方式

目前的自动识别分页还无法识别瑞丽女性网-服饰频道的内容分页,因为分页是JS调用的而且无法识别无标签的连接,也就是纯文本连接...

软件建议区|macrossz|2008-11-04 22:45

3/3778

2016-02-10

解决处理大的页面导致死机的问题

在采集的时候,出现采集一些大的页面,下载超过10秒,并且采集条数比较大,超过200条的时候,火车就占cpu100%,然后死机,无法继续采集的问题。建议修正网页下载超时,网页...

软件建议区|iiwork|2008-11-03 18:21

3/3864

2016-02-10

要是能选择像1.2一样直接发布就好了

要是能选择像1.2一样直接发布就好了

软件建议区|终端传媒|2008-11-01 15:23

3/4376

2016-02-10

建议增加分页连接格式识别功能

如题,这样好让火车头知道哪些是分页,哪些不是

软件建议区|macrossz|2008-11-05 17:52

3/3926

2016-02-10

建议添加 替换 /过滤 词能够 批量导入功能 ,一个一个添加太耗费时间了

软件建议区|fearwall|2008-06-24 10:20

5/6095

2016-02-10

Spider

按照是否匿名和是否遵循robots.txt协议有4种蜘蛛: 1 真名真姓,遵循robots.txt 协议。代表:GoogleBot BaiduSpider MSNBot Yahoo!Slurp 等 2 真名真姓,不遵循robots.txt...

软件建议区|faunus|2008-11-08 15:02

8/9768

2016-02-10

一些使用的功能建议,希望官方采纳

一:采集数据的功能增加: 1.正对数字数据,可以增加运算的功能,其中包含(加减乘除) 例如: 原来数据是:100 采集过后,处理的数据可以在这个数字上+10,或者乘以10%。 ...

软件建议区|edzn|2008-11-08 13:47

5/5367

2016-02-10

2008怎么不能像3.2那样自定义编码了?

2008怎么不能像3.2那样自定义来源站的编码了?这个是个很好很实用的功能啊 怎么就取消了呢?

软件建议区|ws9042|2008-11-09 21:35

2/3267

2016-02-10

建议开发LocoySpider FOR Linux

方便喜欢用Linux的站长采集数据,Linux下不需要装杀毒软件,也提高了采集的速度 而且再也不用怕微软的反盗版大棒了 ...

软件建议区|macrossz|2008-11-06 18:36

6/4694

2016-02-10

建议批量添加过滤

现在写采集的时候 添加过滤的时候,需要一条一条的填进去 有没有办法搞成一行一个过滤,这样可以批量添加进去呢? 一行一个过滤,多少行多少个过滤, 因为我常采一些麻烦的...

软件建议区|狂家三少|2008-03-08 11:11

6/4958

2016-02-10

屏幕抓取(screen scraping ) c#版本

Weather Screen Scraping with C# http://www.csharphelp.com/archives2/archive435.html HTML Screen Scraping using C# .Net WebClient http://www.codersource.net/...

软件建议区|faunus|2008-11-09 13:20

5/7791

2016-02-10

关于全局替换的功能细化建议

近来在采集做一个站,由于使用了大量的标签,启用“全局替换”是无效的。 然而,在单独标签里面做替换是有效果的。于是思考了一下,对于专业的采集器火车头,能否做些功能...

软件建议区|菜鸟开火车|2008-11-15 15:38

2/3636

2016-02-10

Google OpenSocial——社交网站的基础架构

Google似乎是已经宣布要推出OpenSocial,英文Blog里报道很多,但因为正式的东西还没有出现,所以看了一圈,说得也不是很详细,大体是几点: [*]开发者将会得到3个Javascrip...

软件建议区|faunus|2008-11-15 20:46

1/4353

2016-02-10

建议下载功能能增加接标题名命名

有时候要下载附件,但发布却是要上传形式,有些附件是不能提前知道名字的,这样的话要上传附件就得不到那个文件名,也就是说发布不了,如果能增加一个按标题命名,那么就可...

软件建议区|chenfy|2008-11-16 11:11

2/4080

2016-02-09

建议局部应用urlencode

http://bbs.locoy.com/spider-32268-1-1.html 这个帖子中,楼主如果使用urlencode 功能,则会造成不能正确生成网址 如果楼主不使用 urlencode, 则可能在 软件介绍中 出现...

软件建议区|sushy|2008-11-18 14:47

2/3466

2016-02-09

GOOGLE浏览器CHROME的网页抓取原理

分析浏览器去下载网页的过程 [ 本帖最后由 faunus 于 2008-11-19 16:38 编辑 ]

软件建议区|faunus|2008-11-19 16:19

2/3976

2016-02-09

XUL Explorer 使用教程(原创)

https://developer.mozilla.org/en/XUL_Explorer ***** XUL Explorer是一个轻量级的XUL集成开发环境,建成一个XULRunner应用,提供一个简单的方式进行试验XUL 。这...

软件建议区|faunus|2008-11-14 21:54

8/5950

2016-02-09

对转成拼音的建议

我想大家转拼音一般功能都是用在文件名上面吧: 所以建议: 建议一: 希望在转成拼音的后面加一个选择项: 最多转多少个全角字符. 如 10 个全角字符,即 20个英文或者数字. 例...

软件建议区|pagedown231|2008-08-13 22:45

6/4208

2016-02-09

希望有个既支持倒序又支持随机发布功能

简洁一点来讲 比如我每天都会跟踪网易新闻 每天采集到的帖数不一样,比如 今天采集到200篇 可是我只想发布50篇,而这50篇只能从今天采集到的200篇中产生 目前火车头还...

软件建议区|xiongyujie37|2008-11-21 11:34

11/6869

2016-02-09

希望火车头能加入自动导入代理服务器功能

希望火车头能加入自动导入代理服务器功能,现在很多代理IP都是从网上买来的,一般都有自动提取代理IP的功能,比如某淘宝店自动提取地址如下:http://222.186.50.73:8888/api.as...

软件建议区|fogdirt|2013-09-15 23:58

4/3425

2016-02-09

企业微信|手机版|Archiver|火车采集器官方站 ( 皖ICP备06000549 )

GMT+8, 2026-4-30 14:44

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

返回顶部