火车采集器软件交流官方论坛

 找回密码
 加入会员
搜索
火车采集器V9版免费下载火车浏览器 - 可视采集,万能群发,全自动脚本工具
查看: 4155|回复: 3

采集页面时候出现错误:解析内容页时异常

[复制链接]
发表于 2016-5-5 14:47:54 | 显示全部楼层 |阅读模式
解析内容页时异常:The RegEx engine has timed out while trying to match a pattern to an input string. This can occur for many reasons, including very large inputs or excessive backtracking caused by nested quantifiers, back-references and other factors.,URL=


只是有部分页面出现这个错误,导致我部分页面不能采集成功,是什么意思?这个错误应该怎么解决?
发表于 2016-5-5 18:16:40 | 显示全部楼层
正则匹配时超时,可能是待匹配的字符串太长,或者是由于大量嵌套循环、反向引用等原因造成的过度回溯。
我觉得第二点可能性更大些,所以,解决的办法是修改正则表达式!
 楼主| 发表于 2016-5-5 23:39:01 | 显示全部楼层
js2016 发表于 2016-5-5 18:16
正则匹配时超时,可能是待匹配的字符串太长,或者是由于大量嵌套循环、反向引用等原因造成的过度回溯。
我 ...

我也觉得是这原因。但不知道怎么修正,方便加一下你QQ交流吗?
发表于 2016-5-6 10:36:33 | 显示全部楼层
精简规则。能不用正则尽量不要用
您需要登录后才可以回帖 登录 | 加入会员

本版积分规则

QQ|手机版|Archiver|火车采集器官方站 ( 皖ICP备06000549 )

GMT+8, 2024-11-24 23:27

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表