发新话题
打印

可不可以把那个重复的连接搞灵活一点呀!

可不可以把那个重复的连接搞灵活一点呀!

比方说,有一些网页有两种格式的。(像网易)在采集的时候有一部分不可以采集到,但是你改了规则就可以了。但是因为是采集过的地址火车头就直接把他过虑了,这样就没有采到。但如果把地址清空了就会重复发布了。或者做个发布过的就记忆,没有发的就做其他的方法处理。

TOP

支持!

TOP

发新话题
Powered by Discuz! 6.0.0  © 2001-2007 Comsenz Technology Ltd
Processed in 0.196540 second(s), 6 queries, Gzip enabled
当前时区 GMT+8, 现在时间是 2008-12-2 01:39 皖ICP备06000549 清除 Cookies - 联系我们 - 火车采集器官方站 - 静态归档