火车采集器软件交流官方论坛

 找回密码
 加入会员
搜索
火车采集器V9版免费下载火车浏览器 - 可视采集,万能群发,全自动脚本工具
查看: 2639|回复: 3

想采集分类网站的信息,如何能够通过1个规则抓取所有分类信息?

[复制链接]
发表于 2011-4-11 17:10:24 | 显示全部楼层 |阅读模式
目前分类网站如58,每个每份下面的展示页面或者说列表页面都不一样,有自己分类下独特的字段。

这种如果要想采集多个分类下的信息,难道就需要1个规则一个规则的对应建立?

那样后期维护也非常麻烦,一个分类信息网站下面有好几百个具体的子分类。

这种情况到底有没有什么好的抓取办法,能够通过一种规则抓取到大部分的分类下的分类信息呢?
发表于 2011-4-22 14:39:32 | 显示全部楼层
基本很难  一般采集的都是大站的资料 这些大站都有专门维护 还有防采集的
有的站就连URL规律也经常变动的
火车头专门可能采集规则不变呢?
发表于 2011-4-23 16:33:38 | 显示全部楼层
回复 2# 移信通


能被搜索引擎收录,应该就能被采集,
发表于 2011-4-25 16:32:05 | 显示全部楼层
回复 3# zyj33


    不同的  搜索引擎是随机的 没有抓取规则

火车是按照规则开的啊
您需要登录后才可以回帖 登录 | 加入会员

本版积分规则

QQ|手机版|Archiver|火车采集器官方站 ( 皖ICP备06000549 )

GMT+8, 2025-8-27 19:20

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表