火车头无法查看源代码...怎么回事啊,,有人答复吗?
http://onshop.2118.com.cn/findByList.do?method=listmore&fid=15&typeid=0&chengshi=null&pageIndex=1这个是地址..
补充。
地址应该没有问题啊,我这边可以进去的。
斑竹老大,你从首页进去试试。http://onshop.2118.com.cn
查看他的分类信息的页面,火车头抓不倒他的连接数据,你看下就明白了。。
在线等。。
[ 本帖最后由 daile2006 于 2008-10-18 11:47 编辑 ]
老大,,快来看下啊......
老大,,快来看下啊...... 直接点击看看,网址有问题。 地址应该没有问题啊,我这边可以进去的。斑竹老大,你从首页进去试试。http://onshop.2118.com.cn
查看他的分类信息的页面,火车头抓不倒他的连接数据,你看下就明白了。。 他是referer认证的,除非能模拟来源页,否则火车没办法。 除非能模拟来源页.???
怎么模拟来源页?? 斑竹老大,详细的讲讲可以吗,,
http://onshop.2118.com.cn/
我这边看他的分类列表页面是用的框架做的,Iframe是用的这个。
框架连接的地址就是:
http://onshop.2118.com.cn/findByList.do?method=listmore&fid=15&typeid=0&chengshi=null&pageIndex=1
就是这个地址,这个页面只有列表,是独立的列表页面。我在浏览器里面直接查看源代码可以看见html内容,但是用火车头打开就不能返回源代码。。不知道要如何处理。。 很好很经典的案例,
火车在23前应该有结果的
http://onshop.2118.com.cn/index.do?method=displayIndex
与
http://onshop.2118.com.cn/findByList.do?method=listmore&fid=15&typeid=0&chengshi=null&pageIndex=1
注意先后顺序
没有共享CookieContainer吧,
一会帮你去验证是不是有关来源页,
火车的模拟器还验不出来。 嘿嘿,,看来案例是比较经典了,,,
但是我想抓取这个网站数据,要如何做呢.. 希望大家帮我一起讨论一下,这个要如何弄。。。
faunus能加我QQ吗,,我们一起试试,
我的QQ:183102557 这个网页现在要抓取内容该如何抓取啊,哪位大虾能教教我。。。。
在线等,,,
页:
[1]