火车采集器软件交流官方论坛

 找回密码
 加入会员
搜索
火车采集器V9版免费下载火车浏览器 - 可视采集,万能群发,全自动脚本工具
查看: 4928|回复: 5

一个没有何任防采集而火车头无法采集的网站(未解决)

[复制链接]
发表于 2006-12-16 16:52:29 | 显示全部楼层 |阅读模式
http://www.engessay.com/gaozhong/
谁能帮我写一下上面的这个页面的采集规则?我写了好久都不对

[ 本帖最后由 icetroy 于 2006-12-24 14:52 编辑 ]
发表于 2006-12-16 20:27:21 | 显示全部楼层
这站的列表页内置IE都看不到,好像防采了,但内容页可采。可用手工添加地址链接后,再采内容页面

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?加入会员

x
发表于 2006-12-17 12:30:14 | 显示全部楼层

回复 #1 icetroy 的帖子

这个网站使用的是动易2005的系统,应该不会防采集,我估计是这个网页超链接的问题,火车有的时候对这种相对路径识别不是很好,对绝对路径倒是瞒好的!这个网页里的源码超连接都是<a href="/xxx.html"></a>相对根目录的!值得注意!
发表于 2006-12-17 12:32:02 | 显示全部楼层
补充:不过你要是想采集他 的全部文章,你可以把你说的那个地址当作内容页面,使用循环采集,先采集地址,然后导出成TXT,这样也可以的!
 楼主| 发表于 2006-12-17 23:09:01 | 显示全部楼层
真好,多谢各位了
 楼主| 发表于 2006-12-24 14:51:52 | 显示全部楼层
我想采集他的一个栏目,要怎么做,有没有高手可以指导一下?
您需要登录后才可以回帖 登录 | 加入会员

本版积分规则

QQ|手机版|Archiver|火车采集器官方站 ( 皖ICP备06000549 )

GMT+8, 2024-11-18 02:57

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表