求采集方法
怎么采集列表页里面的内容呢给个提示好吗
[ 本帖最后由 lixiangliao 于 2008-10-28 22:36 编辑 ] 很明显是表格呵呵 采集表格里面的 能详细的说一下吗,用火车头才一个星期,这几天天天在研究,不过还是只知皮毛 ad,帮顶 建议分两个来采集,一个专门采集公司信息,一个用循环并添加新记录的方法采集职位信息。
假设只用一个规则采集的话,有两种可能:
要么都用循环,显然太浪费。
要么公司信息不循环,职位循环,那么结果是表中第一个职位上有公司信息,其它职位上没有。
当然,还有一个办法,就是,采集公司信息,循环采集职位信息,但职位信息不是增加为新记录,选择用分隔符连接在上条记录后。
写两个规则采集的好处是:
一个表是公司信息;另一个表是公司职位信息。他们中间共同的纽带就是公司ID。
当然采集的时候注意:由于采集网址重复,所以第一个表的内容列表采集完成后,必须清除PageUrl 下的表内的网址信息。否则会提示重复采集,而造成没办法采集。
不管怎么说,都需要后继加工才能发布。或者发布后再加工。
[ 本帖最后由 sushy 于 2008-6-17 23:32 编辑 ] 谢谢,谢谢大哥, :ali10ls :ali10ls :ali10ls :ali10ls
http://bbs.locoy.com/attachments/month_0806/20080618_523e4ce12e7514e40687Qa3h90o5W5yb.gif
火车头VIP 快乐体验交流群,群号63430304
页:
[1]