发新话题
打印

几个小建议,请开发人员参考一下

几个小建议,请开发人员参考一下

1、批量加入网址规则,增加可以自动累加ABCD………XYZ的序号


2、识别分页位置代码,很多新闻类网站都有类似分页功能, [1][2][下一页],希望每次能把[下一页]的URL截取出来。


3、采集那里,可以多个设置,比如  当[内容]/[标题]为空时,当前页面不采集,跳到下一个采集地址,保证采集质量。

[ 本帖最后由 ffcz 于 2006-4-22 13:17 编辑 ]

TOP

发新话题
Powered by Discuz! 6.0.0  © 2001-2007 Comsenz Technology Ltd
Processed in 0.112216 second(s), 6 queries, Gzip enabled
当前时区 GMT+8, 现在时间是 2008-10-8 15:58 皖ICP备06000549 清除 Cookies - 联系我们 - 火车采集器官方站 - 静态归档