火车采集器软件交流官方论坛

 找回密码
 加入会员
搜索
火车采集器V9版免费下载火车浏览器 - 可视采集,万能群发,全自动脚本工具
查看: 3138|回复: 6

求采集方法

[复制链接]
发表于 2008-6-17 01:41:12 | 显示全部楼层 |阅读模式
怎么采集列表页里面的内容呢
给个提示好吗

[ 本帖最后由 lixiangliao 于 2008-10-28 22:36 编辑 ]

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?加入会员

x
发表于 2008-6-17 02:12:42 | 显示全部楼层
很明显是表格  呵呵 采集表格里面的
 楼主| 发表于 2008-6-17 12:40:39 | 显示全部楼层
能详细的说一下吗,用火车头才一个星期,这几天天天在研究,不过还是只知皮毛
发表于 2008-6-17 13:14:49 | 显示全部楼层
ad,帮顶
发表于 2008-6-17 23:31:03 | 显示全部楼层
建议分两个来采集,一个专门采集公司信息,一个用循环并添加新记录的方法采集职位信息。

假设只用一个规则采集的话,有两种可能:

要么都用循环,显然太浪费。
要么公司信息不循环,职位循环,那么结果是表中第一个职位上有公司信息,其它职位上没有。

当然,还有一个办法,就是,采集公司信息,循环采集职位信息,但职位信息不是增加为新记录,选择用分隔符连接在上条记录后。


写两个规则采集的好处是:

一个表是公司信息;另一个表是公司职位信息。他们中间共同的纽带就是公司ID。

当然采集的时候注意:由于采集网址重复,所以第一个表的内容列表采集完成后,必须清除  PageUrl 下的表内的网址信息。否则会提示重复采集,而造成没办法采集。


不管怎么说,都需要后继加工才能发布。或者发布后再加工。

[ 本帖最后由 sushy 于 2008-6-17 23:32 编辑 ]
 楼主| 发表于 2008-6-18 00:09:31 | 显示全部楼层
谢谢,谢谢大哥,
发表于 2008-6-18 15:42:29 | 显示全部楼层













火车头VIP 快乐体验交流群,群号63430304
您需要登录后才可以回帖 登录 | 加入会员

本版积分规则

QQ|手机版|Archiver|火车采集器官方站 ( 皖ICP备06000549 )

GMT+8, 2025-5-22 10:36

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表