cctext 发表于 2009-8-4 12:12:23

严重问题啊,用着用着突然出错了,弹出错误完全无法采集,规则已传

本帖最后由 cctext 于 2009-8-4 13:51 编辑



已经是第二次了。。。之前采一个站也是,进行大半了,出这个错误,怎么都采不了。。

几乎全部重来啊。。

这次也是,挂了几天我都采了几万网址了。。现在又出这个错。。。

rq204 发表于 2009-8-4 12:31:14

这个是你使用转拼音时出错了,请检查一下出错的网址,然后将规则和网址帖一下,我们来检测是什么问题.

cctext 发表于 2009-8-4 13:14:35

这个是你使用转拼音时出错了,请检查一下出错的网址,然后将规则和网址帖一下,我们来检测是什么问题.
我检查下,问题是,开始的时候是好用的。。突然不行。测试的时候就出这个错,测试页面开始肯定是好用的我才进行正式采集,是吧。

就算我删除了任务,重新导入任务重头开始都不行,只有新解压一份火车,再导入原来备份的规则才起作用。。

cctext 发表于 2009-8-4 13:19:20

试了下,把转拼音去掉真的好用了。

相关的规则的话很简单啊。。
就是从<title>获得标题,然后将标题转拼音,只是我把原来“标题”改成了“文章名称”,转拼音就是对“文章名称”来转换的。

cctext 发表于 2009-8-4 13:22:40

或者是不是覆盖哪个跟转拼音有关的dll文件可以解决?
不过我不知道哪个dll和转拼音有关。。

rq204 发表于 2009-8-4 13:26:51

你上传一下规则

cctext 发表于 2009-8-4 13:50:47

6# rq204

你们导入测试的话很可能没错。。我用新解压的火车导入又好了。用原来出错的那个火车,不管怎么删除任务再导入都出错。

cctext 发表于 2009-8-4 13:56:55

还有这两个:
http://bbs.locoy.com/spider-42092-1-1.html

http://bbs.locoy.com/spider-42091-1-1.html
页: [1]
查看完整版本: 严重问题啊,用着用着突然出错了,弹出错误完全无法采集,规则已传