火车采集器软件交流官方论坛

 找回密码
 加入会员
搜索
火车采集器V9版免费下载火车浏览器 - 可视采集,万能群发,全自动脚本工具
查看: 3578|回复: 6

嵌套的网址列表怎么采集回来呢?

[复制链接]
发表于 2008-4-18 15:15:59 | 显示全部楼层 |阅读模式
范例说明:

比如此列表地址:

http://bbs.eachnet.com/forum_200000020_0_0_0_279.html

可以很轻易的获取其中的列表地址

问题的关键在于,实际上要采集的地址,在每篇文章中他又使用  script 给隐藏起来了


比如:

<script src=http://mirror.community.eachnet.com/readcache_200000020_1200385291,1200385418,1200385422,1200385558,1200385559,1200386792,1200386812,1200386819,1200386854,1200386860_12082688266.html></script>


这样就又需要提取 script 中间嵌入的地址才能够采集

理论上是完全可以采集到的,但是怎样设置呢?

谢谢!
发表于 2008-4-18 15:27:03 | 显示全部楼层
使用多页合并的功能
 楼主| 发表于 2008-4-18 15:34:40 | 显示全部楼层
能不能说明白一些啊?  貌似听不太懂。。。
发表于 2008-4-18 16:19:43 | 显示全部楼层
多页采集
<!-- Forum_info 结束 -->(*)<script src=
></script>(*)<!-- Subject 开始 -->


[ 本帖最后由 fireye 于 2008-4-18 16:25 编辑 ]

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?加入会员

x

评分

1

查看全部评分

 楼主| 发表于 2008-4-18 16:35:17 | 显示全部楼层
谢谢 色色

色色为人忠厚,回答问题非常负责任

建议老大们为色色多加一些车厢!
发表于 2008-4-18 17:27:55 | 显示全部楼层
 楼主| 发表于 2008-4-19 21:54:28 | 显示全部楼层
此文需要更多的朋友看到
您需要登录后才可以回帖 登录 | 加入会员

本版积分规则

QQ|手机版|Archiver|火车采集器官方站 ( 皖ICP备06000549 )

GMT+8, 2026-4-17 20:35

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表