vsgod 发表于 2010-4-2 14:02:25

阿里巴巴会员多页面采集问题。

本帖最后由 vsgod 于 2010-4-2 14:06 编辑

比如说我需要采集的会员网址是:http://wellwax.cn.alibaba.com/,想采集他的联系方式页面中的联系方式:http://wellwax.cn.alibaba.com/athena/contact/wellwax.html,这个多页面采集标签如何设置?

页面地址是选择“在默认页源代码内采集得到网址”还是“依据规则对默认页地址替换生成地址”?


能不能够把详细的规则给告诉我一下,我就是这个详细的规则不知道怎么设置呀?麻烦大家了。需要动态变换的只是会员用户名,如:http://wellwax.cn.alibaba.com/athena/contact/wellwax.html

附上联系方式页面的源代码:<lionmousedown="aliclick(this, '?info_id=5081738');"   class="headerMenuLi"    onclick="simulationLink('http://fanglianjun.cn.alibaba.com/athena/contact/fanglianjun.html')"   onmousedown="return aliclick(this,'?tracelog=website_menu_contact')">
                        联系方式
          </li>

alma 发表于 2010-5-26 23:13:55

阿里巴巴是这样一种情况
1.采集主页地址
2.运用多页采集采集公司介绍页和联系信息页
3.问题是,我只会运用多页采集采集一页,没有办法采集到一块

顶一下
页: [1]
查看完整版本: 阿里巴巴会员多页面采集问题。