v8 bug 可能其他版本也存在
最近疯狂的用火车头采集,都还很好没什么事。但是今天就出现了灵异事件。
可能是采集数据过多,又或者是其他原因。
导致火车头采集时,采集了一点 大概不超过50条左右的记录就不采集了。发布也是如此。
然后点其他规则采集进度条也一动不动的,重启火车头之后又能采集或者发布50条左右然后进度条又不动了
点其他的规则采集,任务是开始了 但是进度条也是丝毫不动。就像图片那样,卡在5那里了不继续采集了
可能说的不太清楚欢迎火车头技术远程观看。 接楼上虽然进度条不动,但是进程的cpu和内存占用 却很高 并且是变动的
第二个 bug貌似之前的火车头也存在
如图所示,当我们某些时候不得不对这个进程重新启动的时候。
火车头如果是最小化状态的话,就是只有小图标在状态栏的时候。
图片中的进程中的进程重启后,火车头位于任务栏的小图标会消失不见。
这个时候我们再次点击桌面的快捷方式的话 也无法打开火车头。
我们必须将这个火车头的进程销毁了,才能打开火车头。
这样的后果是正在运行的任务会被终止。 第3个bug 以前的版本也存在。
当我们正在编辑采集规则的时候,点击状态栏火车头的小图标,整个火车头界面会消失。
然后当我们再次点击状态栏火车头的小图标火车头界面显示,但是无法回到编辑界面。
这样的后果是没有保存规则,需要重新写。 第四个 bug其他版本同样存在
当我们使用任务搜索功能时,一切都是不错的。但是当我们搜索完任务之后将搜索的小组件关闭之后
任务少还无所谓,任务多了就如上图所示了。 滚动条拉到最后了。但是还是有任务没有显示出来。
第五个 bug之前版本同样存在
如图所示,运行队列表。当我们同时有数个任务在采集的时候上面的任务完成了,个别人喜欢移除掉。这样就会导致队列里的数据乱了套 会和下面的进度条里的进度完全不一样。技术员可以自己试验一下 第六个 我认为是bug如果不是bug就是粗心大意!!!
这里面使用正则根本无效 接楼上,只能利用前后截取的功能,不能用正则的方式获取。 第7个bug 之前版本同样存在
主要是将内容添加为新记录时如图所示第一个标签补足之后补足的标签的内容不会在组合标签里面出现 第8个bug之前版本同样存在
标签循环处理添加为新记录时 假设采集到10个分页。其中第2页,第五页标签匹配不上。
那么就会出现 匹配不上的那一页会产生一个空的数据。
标签循环处理用分隔符连接上条记录后 分页匹配不到内容产生空标签 假设采集到5个分页。第2个分页匹配了两条数据,其他两页没有匹配任何数据。分隔符是|||那么等到的结果是
|||匹配第一条记录|||匹配第二条记录||||||||||||
由于是循环并且不是添加为新记录,所以无法对标签为空是标记为未采。
页:
[1]
2