打开本地编辑采集数据超慢,一直都打不开。我的电脑配置是主流电脑。
企业版用户在Vista下,机器码发生变化,无法登陆。
生成的机器码中,出现一个 |
这个是09版新机器码.09版以后都不需要打补丁了--by 飛越無限
采集图片,用2008和2009分别试验
2008:
采集列表
可以采集到地址
用2009,同样的地址,同样范围
采集不到地址,不知道算不算BUG,刚开始测试
我找到答案了,就是编码的问题,默认的GB2312不行,加了个gb2312就没问题了
这不是软件问题。具体分析一下规则,同编码--by 飛越無限
描述:
Stopped working
问题签名:
问题事件名称: APPCRASH
Application Name: LocoySpider.exe
Application Version: 4.0.0.1
Application Timestamp: 489b6e03
Fault Module Name: KERNEL32.dll
Fault Module Version: 6.0.6001.18000
Fault Module Timestamp: 4791a76d
Exception Code: e0434f4d
Exception Offset: 000442eb
OS 版本: 6.0.6001.2.1.0.768.2
区域设置 ID: 2052
阅读隐私声明:
http://go.microsoft.com/fwlink/?linkid=50163&clcid=0x0804
本帖最后由 ahwcz 于 2009-2-12 15:09 编辑
发现一个BUG
对采集好的数据进行编辑时,编辑采集字段下的几个按钮对应的内容混乱。点击一个按钮,出面的画面是上一次按钮应该出现的内容。
例如现在点击的是作者按钮,但出现的是内容的信息
请上图给允说明by -- 飛越無限
多页发布不成功,单页发布可以成功,不知道怎么解决
本帖最后由 明炫网络 于 2009-2-12 02:19 编辑
我说一个比较低级的吧 不知道是不是BUG
用火车采集导航站出现的问题 目标地址:http://daohang.google.cn/youxi.html?ct=cat&cd=-1&cad=8
自定义脚本规则:<a href="[标签:内容]" target=_blank id=(*)>[标签:标题]</a>
实际连接:[参数1]
第一个规则开始:<div class=rc_libTitle> 游戏网游
第一个规则结束:相关搜索:
[第一个规则的目的就是截取游戏网游部分]
第二个规则开始:<div class=rc_libTitle> 休闲小游戏
第二个规则结束:相关搜索: 或者<li><a href="http://www.chinagames.net/node_2165.htm" target=_blank id=AFrqEzdj2FTD4Nn1jUygr_zytIb6t9pZrA:sit:65:1>中国游戏中心</a></li>
[第二个规则的目的就是截取休闲小游戏部分]
[两个规则使用同一个列表地址]
第一个规则能够正常获取到 想要的[内容]与[标题]两个标签的内容 但是第二个在编辑里能够看到已经获取到相应的数据,可是在正式采集的时候却提示“采集内容全部完成√共采集到有效内容0条; ”,根本就采集不到,这个是因为什么呢?明明在测试的时候没有任何问题,可就是采集不行呢?[注:清空站点地址还有清除第一个规则的地址与内容库,第二个规则同样采集不到任何信息]
[另外说明一下:把规则二换到另一个站点规则下也不能采集到,同样是能测试到!]
本帖最后由 minghoo 于 2009-2-12 09:39 编辑
1、采地址一万,中途关闭任务却始终在执行,未见任务关闭
2、导入任务,好象把原任务的地址也继承了(如我原任务是采集某一类的10000条记录,导入记录我改为1000条,执行过程全部报地址排重)
5D6D的 formhash 值 还是无法获取
目前 5D6D的 formhash 值 代码如下
<script type="text/javascript">
if($('postform').elements['formhash']) {
$('postform').elements['formhash'].value = "274e" + "786c" + "1234" + "4067" + "92";
}
</script>
其中 value 值 长短 个数 都不断的变化 !