火车采集器软件交流官方论坛

 找回密码
 加入会员
搜索
火车采集器V9版免费下载火车浏览器 - 可视采集,万能群发,全自动脚本工具
查看: 2092|回复: 6

如何采集网页中注释部分中的链接呢?望高手提供思路

[复制链接]
发表于 2010-7-29 00:09:35 | 显示全部楼层 |阅读模式
采集深度为2
查看列表页源代码,所需链接如下所示:

<!-- <a href="http://***.com" target="_blank" class=m>链接</a> //-->
 楼主| 发表于 2010-7-29 14:20:54 | 显示全部楼层
与不带注释的一样采集。。。。
Babbi 发表于 2010-7-29 08:23


采集不到吧,我试过很多次都不行。。。
 楼主| 发表于 2010-7-29 15:08:14 | 显示全部楼层
把网址贴出来看看。。。
Babbi 发表于 2010-7-29 14:29

我简化一下:

这是起始页地址:
http://www.ovki.cn/start.html

点击进入列表页地址:
http://www.ovki.cn/locoy1.html
http://www.ovki.cn/locoy2.html
http://www.ovki.cn/locoy3.html

查看源码。
里面隐藏有目标内容页网址:
http://www.ovki.cn/link1.html
http://www.ovki.cn/link2.html
http://www.ovki.cn/link3.html

如何才能采集到上述link1,link2,link3网址?
 楼主| 发表于 2010-7-29 16:17:45 | 显示全部楼层
设置:
结果:
Babbi 发表于 2010-7-29 16:00



    非常感谢。

8过可能我没说清楚。
我的意思是 采集网址规则,而不是采集内容规则。
发表于 2010-7-29 16:46:40 | 显示全部楼层
也是可以的。。。
 楼主| 发表于 2010-7-29 19:07:31 | 显示全部楼层
本帖最后由 eyering 于 2010-7-29 19:09 编辑
很无奈。。。。你有仔细研究过吗?
Babbi 发表于 2010-7-29 17:37



    有仔细研究,也尝试了很多次。但我采集到的是这样的结果。


网址提取规则为空,这样应该可以提取出所有网址。


我的是个人版。。。

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?加入会员

x
发表于 2010-7-30 09:40:05 | 显示全部楼层
这上面有些地方是要设置的。。。。

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?加入会员

x
您需要登录后才可以回帖 登录 | 加入会员

本版积分规则

企业微信|手机版|Archiver|火车采集器官方站 ( 皖ICP备06000549 )

GMT+8, 2026-5-2 13:42

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表