火车采集器软件交流官方论坛

 找回密码
 加入会员
搜索
火车采集器V9版免费下载火车浏览器 - 可视采集,万能群发,全自动脚本工具
查看: 3057|回复: 4

可以采集搜索引擎里的快照页面吗?

[复制链接]
发表于 2009-9-18 14:00:24 | 显示全部楼层 |阅读模式
本帖最后由 vsgod 于 2009-9-18 14:02 编辑

我想采集http://info.315.com.cn/sltinfolist?classid=002006006这个页面的内容,但金银岛是收费服务的,我发现在搜索引擎中那些限制为收费的内容会显示出来(http://203.208.39.132/search?q=cache:cN13dblXfDgJ:info.315.com.cn/showinfo1717789.html+%E7%8E%89%E9%97%A8%E7%82%BC%E5%8E%82%E7%9F%B3%E8%9C%A1%E4%BB%B7%E6%A0%BC%E4%B8%8A%E8%B0%83&cd=1&hl=zh-CN&ct=clnk&gl=cn&client=aff-cs-worldbrowser&st_usg=ALhdy2_6zw2vxZ78Qde9H_YEeyN8XDH1og),就有这么一种想法:可不可以通过这个页面的列表查找搜索引擎里的快照页面,然后采集搜索引擎快照页面里的因权限而没有显示的内容。

不知道有没有哪位兄台试过没?非常期待共享方法。。。。。。。。。。。
发表于 2009-9-18 16:44:09 | 显示全部楼层
理论上是可以的,你可以搜索该站在gg上的所有快照,然后采集它们。
发表于 2009-9-18 20:19:51 | 显示全部楼层
可以的     {:4_197:}
发表于 2009-9-19 10:58:56 | 显示全部楼层
应该可以的,ali75ls
 楼主| 发表于 2009-9-20 15:59:26 | 显示全部楼层
2# rq204

行情之类的是每天更新的,过滤非当天的快照可以吧?具体怎么操作呢,请各位指点。。
您需要登录后才可以回帖 登录 | 加入会员

本版积分规则

QQ|手机版|Archiver|火车采集器官方站 ( 皖ICP备06000549 )

GMT+8, 2025-7-15 01:43

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表