火车采集器软件交流官方论坛

 找回密码
 加入会员
搜索
火车采集器V9版免费下载火车浏览器 - 可视采集,万能群发,全自动脚本工具
查看: 9674|回复: 0

速看|火车采集器V9.11版本更新

[复制链接]
发表于 2019-11-21 17:03:55 | 显示全部楼层 |阅读模式

火车采集器

点击上方蓝色字体,关注我们

亲爱的用户:
为了给用户更好的采集体验,2019年11月21日我们进行了火车采集器的版本更新,目前火车采集器V9.11版本已正式上线。
1、★ 列表页新增“地址处理”功能
点击下一页,抓包可获取真实地址:

分析json数据可以得知 url 后面的是内容页网址,设置如下:
              
   

可以看到采集的网址里有很多 \ ,导致网址无法访问,而且网址不规则,不易处理。
      

这种可以使用新增的“地址处理”功能
内容替换/排重
   可以对网址中内容进行替换,且替换完成后,重复的网址会自动去重。




纯正则替换
  可以使用正则表达式进行匹配,和内容替换功能类似
字符编码处理
  网址中有需要转码的内容,比如采到的链接里有 & 可以进行解码
2、★新增“请求失败数”的预警条件设置


3、★下载图片命名,新增[记录自增Id]格式
记录自增ID:同一个内容页中,多个标签设置记录自增ID,那么多个标签都是从1开始自增,再次测试运行又会重新开始从1自增,更换个内容页测试运行,也是从1开始自增。
自增ID:设置自增ID是采集器启动后运行,开始一个自增ID,从1开始自增,之后就是自增。重启采集器后,又会重新开始自增ID,从1开始自增。
举例说明:自增记录ID:缩略图和内容两个标签都有图片下载,都设置了记录自增ID。


更换一个内容页网址,记录自增ID还是从1开始自增。
https://zhishi.fang.com/jiaju/qg_691372.html

自增ID:内容标签中设置了自增ID。

之后就会一直自增。
想要自增ID再次从1开始,需要重启采集器,那么就会从1开始了,否则只要设置了自增ID的,都会一直自增下去。

4、★修复图片下载误判断问题★

5、★修复计划任务中“每天调度”,起始运行时间配置未生效的问题★

6、★ 修复PHP插件,对于循环记录的处理报错的问题

7、★修复拼音首字母对于一些错误字符的判断问题

8、★任务批量编辑,修复“发布”中“多网站乱序发布”未能复制的问题
9、★修改“循环添加新记录”配置后,修复数据格式选择错误的问题★

10、★修复循环记录中列表页标签被多次处理的问题★

11、★修复对于一些302跳转地址,无法正确跳转的问题★

12、★修复一些网址无法正确请求的问题★

感谢用户的支持与使用,今后也请多多支持小采~



本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?加入会员

x
您需要登录后才可以回帖 登录 | 加入会员

本版积分规则

QQ|手机版|Archiver|火车采集器官方站 ( 皖ICP备06000549 )

GMT+8, 2024-11-22 06:18

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表