采集页面时候出现错误：解析内容页时异常

benray 发表于 2016-5-5 14:47:54

解析内容页时异常:The RegEx engine has timed out while trying to match a pattern to an input string. This can occur for many reasons, including very large inputs or excessive backtracking caused by nested quantifiers, back-references and other factors.,URL=

只是有部分页面出现这个错误，导致我部分页面不能采集成功，是什么意思？这个错误应该怎么解决?

js2016 发表于 2016-5-5 18:16:40

正则匹配时超时，可能是待匹配的字符串太长，或者是由于大量嵌套循环、反向引用等原因造成的过度回溯。
我觉得第二点可能性更大些，所以，解决的办法是修改正则表达式！

benray 发表于 2016-5-5 23:39:01

js2016 发表于 2016-5-5 18:16
正则匹配时超时，可能是待匹配的字符串太长，或者是由于大量嵌套循环、反向引用等原因造成的过度回溯。
我 ...

我也觉得是这原因。但不知道怎么修正，方便加一下你QQ交流吗？

303718 发表于 2016-5-6 10:36:33

精简规则。能不用正则尽量不要用

页: [1]

火车采集器软件交流官方论坛's Archiver

采集页面时候出现错误：解析内容页时异常