vsgod 发表于 2009-9-18 14:00:24

可以采集搜索引擎里的快照页面吗?

本帖最后由 vsgod 于 2009-9-18 14:02 编辑

我想采集http://info.315.com.cn/sltinfolist?classid=002006006这个页面的内容,但金银岛是收费服务的,我发现在搜索引擎中那些限制为收费的内容会显示出来(http://203.208.39.132/search?q=cache:cN13dblXfDgJ:info.315.com.cn/showinfo1717789.html+%E7%8E%89%E9%97%A8%E7%82%BC%E5%8E%82%E7%9F%B3%E8%9C%A1%E4%BB%B7%E6%A0%BC%E4%B8%8A%E8%B0%83&cd=1&hl=zh-CN&ct=clnk&gl=cn&client=aff-cs-worldbrowser&st_usg=ALhdy2_6zw2vxZ78Qde9H_YEeyN8XDH1og),就有这么一种想法:可不可以通过这个页面的列表查找搜索引擎里的快照页面,然后采集搜索引擎快照页面里的因权限而没有显示的内容。

不知道有没有哪位兄台试过没?非常期待共享方法。。。。。。。。。。。

rq204 发表于 2009-9-18 16:44:09

理论上是可以的,你可以搜索该站在gg上的所有快照,然后采集它们。

jueshihaogongzi 发表于 2009-9-18 20:19:51

可以的   {:4_197:}

采花大盗 发表于 2009-9-19 10:58:56

应该可以的,ali75ls

vsgod 发表于 2009-9-20 15:59:26

2# rq204

行情之类的是每天更新的,过滤非当天的快照可以吧?具体怎么操作呢,请各位指点。。
页: [1]
查看完整版本: 可以采集搜索引擎里的快照页面吗?