火车采集器软件交流官方论坛

 找回密码
 加入会员
搜索
火车采集器V9版免费下载火车浏览器 - 可视采集,万能群发,全自动脚本工具
查看: 2203|回复: 2

请教一下,这个规则哪里不对?有的页面采集不到

[复制链接]
发表于 2011-7-20 10:03:55 | 显示全部楼层 |阅读模式
本帖最后由 yang131261 于 2011-7-20 14:20 编辑

http://b2b.hc360.com/supplyself/78086679.html  这个页面的源码内有这么一段

    <div class="column_con p10">
                               <h3><a href="http://wdhaodun.b2b.hc360.com" target="_blank" rel="hcdetail_supplyselflog=supplyselfright&hcdetail_secondlog=company">文登市豪顿风机有限公司</a></h3>


http://b2b.hc360.com/supplyself/123570269.html  这个页面的源码内也有这么一段

<div class="column_con p10">
                               <h3><a href="http://zdf88.b2b.hc360.com/" target="_blank" rel="hcdetail_supplyselflog=supplyselfright&hcdetail_secondlog=company">张笃峰(个人商户)</a></h3>

我想得到会员登录名 在标签的设置规则里这么写

<div class="column_con p10">
                               <h3><a href="http://[参数].b2b.hc360.com/" target="_blank" rel="hcdetail_supplyselflog=supplyselfright&hcdetail_secondlog=company">(*)</a></h3>(这个利用的是第二个页面里的)


在组合结果里写

[参数1]                                 然后结果就是第二个页面可以得到参数1的内容  第一个页面参数1的内容为空,请教一下这个是什么原因?
 楼主| 发表于 2011-7-20 10:37:47 | 显示全部楼层
终于解决了  找了半天终于发现不同了  第一个页面是http://wdhaodun.b2b.hc360.com

第二个页面是http://zdf88.b2b.hc360.com/    多了一个/   应该在规则里这样写

<div class="column_con p10">
                               <h3><a href="http://[参数].b2b.hc360.com(*)" target="_blank" rel="hcdetail_supplyselflog=supplyselfright&hcdetail_secondlog=company">(*)</a></h3>(这个利用的是第二个页面里的)
发表于 2011-7-20 11:56:16 | 显示全部楼层
您需要登录后才可以回帖 登录 | 加入会员

本版积分规则

QQ|手机版|Archiver|火车采集器官方站 ( 皖ICP备06000549 )

GMT+8, 2025-5-17 16:38

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表