发新话题
打印

[3.2版] 多页面循环采集的解决办法

多页面循环采集的解决办法

我的网站: http://kbb.365pro.net
采集内容来自: http://kbis08.mapyourshow.com/1_0/kbis08_showfeaturelist.cfm?offset=8
来源内容页 0 设置, 包含8个产品 , 我同时希望采集到8个不同能够产品的公司的联系信息. 怎么解决呢??

我的解决办法比较笨 .  首先采集当前页面 批量添加 任务,设置采集标签, 循环匹配- 然后发布到本地html

然后发布本地html 成功后 , 再使用我的本地的vertrigo 服务器,或者你的IIS, 原谅我说的比较笨 :-(

再建立个任务, 在发布的本地的文件中进行分页采集, 我的标签重新设置如下:

这样就再在线发布一次了..

希望我能说得明白..

[ 本帖最后由 asialove 于 2008-5-20 23:07 编辑 ]
附件: 您所在的用户组无法下载或查看附件

TOP

多页采集,看来确实需要出一个教程。
火车采集器系列教程第二期,陆续发布中。
已休息仨月,现对外接单,火车商业版、采集规则、发布模块、程序接口等.QQ:130775

搜狗图片采集程序出售美眉小说
四维空间
百部小说

TOP

再补充下

需要采集的页面包含8个不同产品,我都需要循环采集下来,但是每个产品的公司不同,我需要整合下产品介绍,图片及公司联系方式-这个时候 循环匹配标签的话,就只能采集第一个的其他页面的公司联系方式部分。。其他人看看有没有更为有效的办法来解决。。

TOP

引用:
原帖由 vus520 于 2008-5-20 22:49 发表
多页采集,看来确实需要出一个教程。
支持你.

TOP

引用:
原帖由 vus520 于 2008-5-20 22:49 发表
多页采集,看来确实需要出一个教程。
支持你.

TOP

发新话题
Powered by Discuz! 6.0.0  © 2001-2007 Comsenz Technology Ltd
Processed in 0.171742 second(s), 6 queries, Gzip enabled
当前时区 GMT+8, 现在时间是 2008-7-6 05:18 皖ICP备06000549 清除 Cookies - 联系我们 - 火车采集器官方站 - 静态归档 - WAP