火车采集器软件交流官方论坛

 找回密码
 加入会员
搜索
火车采集器V9版免费下载火车浏览器 - 可视采集,万能群发,全自动脚本工具
查看: 2450|回复: 1

V7 多级网址获取里的手动获取无效

[复制链接]
发表于 2012-3-16 21:25:39 | 显示全部楼层 |阅读模式
已经升级到最新版

以火车的官网为例,网址:http://bbs.locoy.com/netget-53-1.html

采集列表里面带new的主题
带new的源代码大概是这样
  1. <a href="http://bbs.locoy.com/spider-70545-1-1.html" onclick="atarget(this)" class="xst" >:s激活用户出错:-6,使用了一个随机用户:</a>
  2. <img src="static/image/filetype/image_s.gif" alt="attach_img" title="图片附件" align="absmiddle" />
  3. <a href="http://bbs.locoy.com/forum.php?mod=redirect&amp;tid=70545&amp;goto=lastpost#lastpost" class="xi1">New</a>
复制代码
这是一段带new字样的链接代码,需要的链接是http://bbs.locoy.com/spider-70545-1-1.html

采集网址里面采用多级网址获取-》手动获取。
我的脚步规则
  1. <a href="[参数]" onclick="atarget(this)" class="xst" >(*)</a>
  2. <img src="static/image/filetype/image_s.gif" alt="attach_img" title="图片附件" align="absmiddle" />
  3. <a href="(*)>New</a>
复制代码
或者

  1. <a href="[参数]" onclick="atarget(this)" class="xst" >(*)</a>
  2. <img src="static/image/filetype/image_s.gif" alt="attach_img" title="图片附件" align="absmiddle" />
  3. <a href="http://bbs.locoy.com/forum.php?mod=redirect&amp;tid=70545&amp;goto=lastpost#lastpost" class="xi1">New</a>
复制代码
实际链接就是[参数]

采集出来的网址是包含整个页面的HTML代码。

不知道是我写错了还是什么,我不只在一个网站采集测试论坛带new字样的链接,都是采集出来的网址带HTML代码。

如果是BUG,请尽快修复。


发表于 2012-3-17 13:55:22 | 显示全部楼层
这个不是bug,程序只是提取符合条件的数据,请检查您的采集规则。
您需要登录后才可以回帖 登录 | 加入会员

本版积分规则

QQ|手机版|Archiver|火车采集器官方站 ( 皖ICP备06000549 )

GMT+8, 2024-11-23 22:12

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表