yang131261 发表于 2011-7-20 10:03:55

请教一下,这个规则哪里不对?有的页面采集不到

本帖最后由 yang131261 于 2011-7-20 14:20 编辑

http://b2b.hc360.com/supplyself/78086679.html这个页面的源码内有这么一段

    <div class="column_con p10">
                           <h3><a href="http://wdhaodun.b2b.hc360.com" target="_blank" rel="hcdetail_supplyselflog=supplyselfright&hcdetail_secondlog=company">文登市豪顿风机有限公司</a></h3>


http://b2b.hc360.com/supplyself/123570269.html这个页面的源码内也有这么一段

<div class="column_con p10">
                           <h3><a href="http://zdf88.b2b.hc360.com/" target="_blank" rel="hcdetail_supplyselflog=supplyselfright&hcdetail_secondlog=company">张笃峰(个人商户)</a></h3>

我想得到会员登录名 在标签的设置规则里这么写

<div class="column_con p10">
                           <h3><a href="http://[参数].b2b.hc360.com/" target="_blank" rel="hcdetail_supplyselflog=supplyselfright&hcdetail_secondlog=company">(*)</a></h3>(这个利用的是第二个页面里的)


在组合结果里写

[参数1]                                 然后结果就是第二个页面可以得到参数1的内容第一个页面参数1的内容为空,请教一下这个是什么原因?

yang131261 发表于 2011-7-20 10:37:47

终于解决了找了半天终于发现不同了第一个页面是http://wdhaodun.b2b.hc360.com

第二个页面是http://zdf88.b2b.hc360.com/    多了一个/   应该在规则里这样写

<div class="column_con p10">
                               <h3><a href="http://[参数].b2b.hc360.com(*)" target="_blank" rel="hcdetail_supplyselflog=supplyselfright&hcdetail_secondlog=company">(*)</a></h3>(这个利用的是第二个页面里的)

专业收费采集 发表于 2011-7-20 11:56:16

ali81lsali81lsali81ls
页: [1]
查看完整版本: 请教一下,这个规则哪里不对?有的页面采集不到