火车采集器软件交流官方论坛

 找回密码
 加入会员
搜索
火车采集器V9版免费下载火车浏览器 - 可视采集,万能群发,全自动脚本工具
查看: 3649|回复: 3

能力有限无奈用求救 ~ 火车的 2 个问题

[复制链接]
发表于 2007-4-11 13:24:21 | 显示全部楼层 |阅读模式
本人以前用其他采集 由于手动量大

所以再次选择火车

前几个网站都能够顺利采集

但是后面就出问题了

比如这个列表页面  http://www.44xp.com/html/zp/ (特别提醒:页面有流氓插件,请开杀毒软件)

采集到的文章列表是这样的。如图:


出现的是网此重复


于是打开代码查看结构 结果如下:

  1. <a href="/html/zp/2007/4-10/90701284.html" title="洋妞跳扇子舞,跳著跳著衣服跳沒了" target=_blank>洋妞跳扇子舞,跳著跳著衣服跳沒了</a></td>
复制代码


使用的是
  1. <a href="/html/zp/2007/4-10/90701284.html
复制代码
根据火车提供的自定义连接 但是弄了半天没弄好以失败告终

望高手指点


问题二:

在需要登陆的论坛采集失败。无论是用火车的登陆器登陆 还是用专门的 COOKIES 抓取软件 获得

但是都出现 采集器不访问,根本不连接网站了。



望有经验的朋友指点一下

[ 本帖最后由 chinalini 于 2007-4-11 13:26 编辑 ]

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?加入会员

x
 楼主| 发表于 2007-4-11 13:40:01 | 显示全部楼层
这样的问题 怎么没人解释一下哦 火车斑竹些
发表于 2007-4-11 18:14:59 | 显示全部楼层
问题一:采集全部网址,导出二级网址,将html/zp/\"/html替换为html
问题二:可能是网站有防采的功能,建议放弃。

评分

1

查看全部评分

发表于 2007-4-11 20:28:20 | 显示全部楼层
导出二级节点,用记事本编辑一下吧

第二个问题,我想很多人都碰到过,应该就是cookie的问题,到不象防采的问题。
例如这个网站要是有多个论坛放在一个数据库里,cookie就和默认的不一样,取下来也不一定能登录上,我碰到过多次,这样的,一贴在火车里面就提示我cookie有问题,没办法

评分

1

查看全部评分

您需要登录后才可以回帖 登录 | 加入会员

本版积分规则

QQ|手机版|Archiver|火车采集器官方站 ( 皖ICP备06000549 )

GMT+8, 2026-4-3 14:52

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表