lixiangliao 发表于 2008-6-17 01:41:12

求采集方法

怎么采集列表页里面的内容呢
给个提示好吗

[ 本帖最后由 lixiangliao 于 2008-10-28 22:36 编辑 ]

xiongyujie37 发表于 2008-6-17 02:12:42

很明显是表格呵呵 采集表格里面的

lixiangliao 发表于 2008-6-17 12:40:39

能详细的说一下吗,用火车头才一个星期,这几天天天在研究,不过还是只知皮毛

qq-fantizi 发表于 2008-6-17 13:14:49

ad,帮顶

sushy 发表于 2008-6-17 23:31:03

建议分两个来采集,一个专门采集公司信息,一个用循环并添加新记录的方法采集职位信息。

假设只用一个规则采集的话,有两种可能:

要么都用循环,显然太浪费。
要么公司信息不循环,职位循环,那么结果是表中第一个职位上有公司信息,其它职位上没有。

当然,还有一个办法,就是,采集公司信息,循环采集职位信息,但职位信息不是增加为新记录,选择用分隔符连接在上条记录后。


写两个规则采集的好处是:

一个表是公司信息;另一个表是公司职位信息。他们中间共同的纽带就是公司ID。

当然采集的时候注意:由于采集网址重复,所以第一个表的内容列表采集完成后,必须清除PageUrl 下的表内的网址信息。否则会提示重复采集,而造成没办法采集。


不管怎么说,都需要后继加工才能发布。或者发布后再加工。

[ 本帖最后由 sushy 于 2008-6-17 23:32 编辑 ]

lixiangliao 发表于 2008-6-18 00:09:31

谢谢,谢谢大哥,

ruyi0296 发表于 2008-6-18 15:42:29

:ali10ls :ali10ls :ali10ls :ali10ls











http://bbs.locoy.com/attachments/month_0806/20080618_523e4ce12e7514e40687Qa3h90o5W5yb.gif
火车头VIP 快乐体验交流群,群号63430304
页: [1]
查看完整版本: 求采集方法