火车采集器软件交流官方论坛

 找回密码
 加入会员
搜索
火车采集器V9版免费下载火车浏览器 - 可视采集,万能群发,全自动脚本工具
查看: 3603|回复: 2

“自定义链接”会丢掉近一半链接

[复制链接]
发表于 2007-12-5 18:35:24 | 显示全部楼层 |阅读模式
目标地址:http://baby.sina.com.cn/health/jb_bb/qt.html
脚本规则:data_p[(*)][1]='(*)/health/[参数]';
实际链接:/health/[参数1]

400余个链接有将近390余个符合该规则,但是只能采集到209个。

找了个同样规则下条数比较少的栏目逐条比较(http://baby.sina.com.cn/health/jb_bb/sj.html)发现它忽略掉了50%以后的内容。断开处没有任何特征,也许是程序的BUG吧?
发表于 2007-12-5 19:41:36 | 显示全部楼层
data_p
  • [1]='/health/07/[参数]';
    data_p[(*)][1]='(*)/health/[参数]'; ----加一个*在=后干什么呀
  •  楼主| 发表于 2007-12-5 19:48:36 | 显示全部楼层
    有的链接是完整地址,前面有“http://baby.sina.com.cn”。
    另外去掉这个结果是一样的,所以问题不在这里。
    您需要登录后才可以回帖 登录 | 加入会员

    本版积分规则

    QQ|手机版|Archiver|火车采集器官方站 ( 皖ICP备06000549 )

    GMT+8, 2024-10-6 19:36

    Powered by Discuz! X3.4

    Copyright © 2001-2020, Tencent Cloud.

    快速回复 返回顶部 返回列表