图片采集,内容页中的图片,让火车头采集器中一张,他怎么都采下来了啊
内容页规则,排除了一部分网页内容,这样就剩下一张图片需要采集了。但是火车头在采集时,把原来网页中的其它图片也给采集下载下来了!! 请问,火车头的排除、替换规则是怎么个顺序?? 图片下载,应该是被采集区域内部的图片才对啊,被排除的区域,既然不采集了,为什么火车头还要下载图片呢?搞不懂!! 搜索了论坛,竟然没有人提出来!! 这不是个bug?有没有办法回避? 就是说,被采集页上中下两部分,都是图片加文字,在采集器中设置采集上部分+下半部分,把中间那部分的图文给排除了!!结果采集发布都正常——就是有一点异常: 火车头把中间的那部分的图片也给采集下来了(文字,当然没采集:采集后的发布内容完全没有中间那部分的影子:满足要求——就是她画蛇添足的把中间那部分排除掉的网页代码中的图片也给Download下来了,wow,占用了大量空间,我也不好分辨哪些图片需要手动删除)
页:
[1]