|
本帖最后由 vsgod 于 2010-4-2 14:06 编辑
比如说我需要采集的会员网址是:http://wellwax.cn.alibaba.com/,想采集他的联系方式页面中的联系方式:http://wellwax.cn.alibaba.com/athena/contact/wellwax.html,这个多页面采集标签如何设置?
页面地址是选择“在默认页源代码内采集得到网址”还是“依据规则对默认页地址替换生成地址”?
能不能够把详细的规则给告诉我一下,我就是这个详细的规则不知道怎么设置呀?麻烦大家了。需要动态变换的只是会员用户名,如:http://wellwax.cn.alibaba.com/athena/contact/wellwax.html
附上联系方式页面的源代码:- <li onmousedown="aliclick(this, '?info_id=5081738');" class="headerMenuLi" onclick="simulationLink('http://fanglianjun.cn.alibaba.com/athena/contact/fanglianjun.html')" onmousedown="return aliclick(this,'?tracelog=website_menu_contact')">
- 联系方式
- </li>
复制代码 |
|