这个奇怪的网站如何采集?
www.8181.com.cn首先需要注册,哪位大神有兴趣可以注册后研究一下。
这个网站奇怪之处在于:
一是按“高级条件”搜索结果后,网址并不变化,即使获取浏览器的Cookie,火车头也无法采集到搜索结果网页里的网址。
二是点击“浙江 男”的所有网友信息,把网址复制到火车头浏览器里,也同样打不开这个网址。
三是貌似cookie总是掉。
四是在网站里搜索后会出来一串类似http://....&sex=男&Olabum=1之类的网址,放到火车头里还是打不开。 可以采集得到啊 ~~~~~~~~~~ huayi521 发表于 2014-9-1 21:30 static/image/common/back.gif
可以采集得到啊 ~~~~~~~~~~
谢谢,怎么取啊,一个是搜索结果怎么采集成起始网址?二个是结果页面里还需要点击“联系方式”后打开新网址,新网址中有具体的QQ账号,怎样能把结果页面和这个联系方式同时取下来? 『采集超市』www.locoymall.com
支持采集zencart、opencart、x-cart、magento、SV-CART、 osCommerce、TomatoCart、PrestaShop、shopex、ecshop、ecmall、dedecms、phpweb、 KeeShop、TinyShop、 iWebShop、Easycart等等商城,支持自建商城,欢迎咨询洽谈!
专注于火车头规则、插件、模块、接口定制!为企业和个人全方位的采集发布方案!
联系QQ:137178124
官方网站:www.locoymall.com
http://bbs.locoy.com/data/attachment/forum/201310/21/002539x2g25ntt59yx85xt.gif 老是有人说可以采集,要先付钱再干活,不知道真假。
我用webbrowser+excel最笨的办法,先把网民的地址采集下来再用火车头搞定了。
页:
[1]