火车采集器软件交流官方论坛

 找回密码
 加入会员
搜索
火车采集器V9版免费下载火车浏览器 - 可视采集,万能群发,全自动脚本工具
查看: 4540|回复: 9

火车头无法查看源代码...怎么回事啊,,有人答复吗?

[复制链接]
发表于 2008-10-17 17:30:48 | 显示全部楼层 |阅读模式
http://onshop.2118.com.cn/findByList.do?method=listmore&fid=15&typeid=0&chengshi=null&pageIndex=1

这个是地址..
补充。


地址应该没有问题啊,我这边可以进去的。
斑竹老大,你从首页进去试试。http://onshop.2118.com.cn
查看他的分类信息的页面,火车头抓不倒他的连接数据,你看下就明白了。。

在线等。。

[ 本帖最后由 daile2006 于 2008-10-18 11:47 编辑 ]
 楼主| 发表于 2008-10-17 17:42:44 | 显示全部楼层

老大,,快来看下啊......

老大,,快来看下啊......
发表于 2008-10-17 17:43:51 | 显示全部楼层
直接点击看看,网址有问题。
 楼主| 发表于 2008-10-18 11:48:33 | 显示全部楼层
地址应该没有问题啊,我这边可以进去的。
斑竹老大,你从首页进去试试。http://onshop.2118.com.cn
查看他的分类信息的页面,火车头抓不倒他的连接数据,你看下就明白了。。
发表于 2008-10-18 13:17:42 | 显示全部楼层
他是referer认证的,除非能模拟来源页,否则火车没办法。
 楼主| 发表于 2008-10-19 11:58:01 | 显示全部楼层
除非能模拟来源页.???
怎么模拟来源页?? 斑竹老大,详细的讲讲可以吗,,

http://onshop.2118.com.cn/
我这边看他的分类列表页面是用的框架做的,Iframe是用的这个。
框架连接的地址就是:
http://onshop.2118.com.cn/findBy ... ull&pageIndex=1

就是这个地址,这个页面只有列表,是独立的列表页面。我在浏览器里面直接查看源代码可以看见html内容,但是用火车头打开就不能返回源代码。。不知道要如何处理。。
发表于 2008-10-19 13:28:32 | 显示全部楼层
很好很经典的案例,
火车在23前应该有结果的

http://onshop.2118.com.cn/index.do?method=displayIndex

http://onshop.2118.com.cn/findBy ... ull&pageIndex=1
注意先后顺序
没有共享CookieContainer吧,
一会帮你去验证是不是有关来源页,
火车的模拟器还验不出来。
 楼主| 发表于 2008-10-20 09:08:25 | 显示全部楼层
嘿嘿,,看来案例是比较经典了,,,
但是我想抓取这个网站数据,要如何做呢..
 楼主| 发表于 2008-10-20 09:10:45 | 显示全部楼层
希望大家帮我一起讨论一下,这个要如何弄。。。

faunus  能加我QQ吗,,我们一起试试,
我的QQ:183102557
 楼主| 发表于 2008-10-20 12:01:28 | 显示全部楼层
这个网页现在要抓取内容该如何抓取啊,哪位大虾能教教我。。。。

在线等,,,
您需要登录后才可以回帖 登录 | 加入会员

本版积分规则

QQ|手机版|Archiver|火车采集器官方站 ( 皖ICP备06000549 )

GMT+8, 2025-7-17 17:34

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表