johnnywill 发表于 2009-3-4 15:42:21

登录后可以查看源代码但采不到任何东西

在没有登录网站的情况下,我可以采得到网站的内容,但不是我想要的。
我需要的东西要登录后才能看到。但是,等我登录之后,点击采集内容规则里的“采集页面测试”,什么都采不到,点击“源代码”确是可以看到我要的东西。规则应该没有错的。有没有人遇到过这种情况?

rq204 发表于 2009-3-4 16:10:16

你要获取正确登陆信息,可能你获取的错误或过期.

johnnywill 发表于 2009-3-4 16:40:45

点了“测试”,一般来说,可以看到那个猴子在动,然后才显示采集结果。但是待我登录之后火车头记录下了cookie,再点击“测试”,见不到猴子了,而是立即就显示采集内容为空,感觉好像是火车头根本就没有采。我点击“源代码”可以看到所有的我要的内容。

zydxdx 发表于 2009-3-4 16:48:41

如果确认规则没错的话 那就是cookie问题相当于你没有登陆上 没有足够权限查看页面信息
当然规则就匹配不了网页 就没有出现采集过程

johnnywill 发表于 2009-3-4 17:03:19

谢谢楼上的分析,我测试了任意规则随意采集内容,都是空。所以不是规则的问题。确实有可能是cookie的问题,但不知该如何解决。我设置了保留cookie一年,但是隔一会儿再试,又显示未登录。这种情况是不是没法采?
页: [1]
查看完整版本: 登录后可以查看源代码但采不到任何东西