玉树TMD临风 发表于 2014-9-1 20:57:28

这个奇怪的网站如何采集?

www.8181.com.cn

首先需要注册,哪位大神有兴趣可以注册后研究一下。

这个网站奇怪之处在于:

一是按“高级条件”搜索结果后,网址并不变化,即使获取浏览器的Cookie,火车头也无法采集到搜索结果网页里的网址。

二是点击“浙江 男”的所有网友信息,把网址复制到火车头浏览器里,也同样打不开这个网址。

三是貌似cookie总是掉。

四是在网站里搜索后会出来一串类似http://....&sex=男&Olabum=1之类的网址,放到火车头里还是打不开。

huayi521 发表于 2014-9-1 21:30:26

可以采集得到啊 ~~~~~~~~~~

玉树TMD临风 发表于 2014-9-1 21:39:14

huayi521 发表于 2014-9-1 21:30 static/image/common/back.gif
可以采集得到啊 ~~~~~~~~~~

谢谢,怎么取啊,一个是搜索结果怎么采集成起始网址?二个是结果页面里还需要点击“联系方式”后打开新网址,新网址中有具体的QQ账号,怎样能把结果页面和这个联系方式同时取下来?

采集超市 发表于 2014-9-5 15:20:52

『采集超市』www.locoymall.com
支持采集zencart、opencart、x-cart、magento、SV-CART、 osCommerce、TomatoCart、PrestaShop、shopex、ecshop、ecmall、dedecms、phpweb、 KeeShop、TinyShop、 iWebShop、Easycart等等商城,支持自建商城,欢迎咨询洽谈!













专注于火车头规则、插件、模块、接口定制!为企业和个人全方位的采集发布方案!
联系QQ:137178124
官方网站:www.locoymall.com



http://bbs.locoy.com/data/attachment/forum/201310/21/002539x2g25ntt59yx85xt.gif

玉树TMD临风 发表于 2014-11-7 21:40:24

老是有人说可以采集,要先付钱再干活,不知道真假。

我用webbrowser+excel最笨的办法,先把网民的地址采集下来再用火车头搞定了。
页: [1]
查看完整版本: 这个奇怪的网站如何采集?