阿里巴巴会员多页面采集问题。
本帖最后由 vsgod 于 2010-4-2 14:06 编辑比如说我需要采集的会员网址是:http://wellwax.cn.alibaba.com/,想采集他的联系方式页面中的联系方式:http://wellwax.cn.alibaba.com/athena/contact/wellwax.html,这个多页面采集标签如何设置?
页面地址是选择“在默认页源代码内采集得到网址”还是“依据规则对默认页地址替换生成地址”?
能不能够把详细的规则给告诉我一下,我就是这个详细的规则不知道怎么设置呀?麻烦大家了。需要动态变换的只是会员用户名,如:http://wellwax.cn.alibaba.com/athena/contact/wellwax.html
附上联系方式页面的源代码:<lionmousedown="aliclick(this, '?info_id=5081738');" class="headerMenuLi" onclick="simulationLink('http://fanglianjun.cn.alibaba.com/athena/contact/fanglianjun.html')" onmousedown="return aliclick(this,'?tracelog=website_menu_contact')">
联系方式
</li> 阿里巴巴是这样一种情况
1.采集主页地址
2.运用多页采集采集公司介绍页和联系信息页
3.问题是,我只会运用多页采集采集一页,没有办法采集到一块
顶一下
页:
[1]