火车采集器软件交流官方论坛

 找回密码
 加入会员
搜索
火车采集器V9版免费下载火车浏览器 - 可视采集,万能群发,全自动脚本工具
查看: 2287|回复: 7

问一个非常简单的问题,真的非常简单。。

[复制链接]
发表于 2011-3-17 05:35:54 | 显示全部楼层 |阅读模式
在页面上采集网址时,这些网址都是转到另外一个网站的地址,格式都是前面一长串后面一截才是真实的要采集信息的页面地址,如果直接用采集到的地址的话采集不到所需要的信息,请问如何把提供需要信息的地址转换成实际地址。
http://out.XXXX.com/go-to?external_url=http://www.YYY.com/232323
http://out.XXXX.com/go-to?external_url=http://www.YYY.com/656356
http://out.XXXX.com/go-to?external_url=http://www.YYY.com/6543553
.....
这是直接从单页面上采集到的地址格式,而真实的,可以提供所需要信息采集的是后面的http://www.YYY.com/232323...这个地址,我不会设置手动填写地址规则,请哪位高手指点一下,让我用火车头直接在http://www.YYY.com/232323这样的页面上采集信息,并且不再在http://www.YYY.com/232323这样的页面上进一步采集网址。
谢谢
发表于 2011-3-17 09:58:00 | 显示全部楼层
你好。用自定义链接试试
发表于 2011-3-17 10:30:59 | 显示全部楼层
自定义链接直接替换掉就可以了吧!
 楼主| 发表于 2011-3-18 00:01:23 | 显示全部楼层
楼上二位高手能说详细点吗?我用的是2010SP2免费版,我没有什么HTML语言基础,请告诉我如何替换,只在第一步采集网址规则那里看到一个默认的“从页面自动分析得到地址链接”和一个“手动填写地址链接规则”
 楼主| 发表于 2011-3-18 06:40:08 | 显示全部楼层
自定义链接怎么用啊,能说详细点吗?
发表于 2011-3-18 10:15:26 | 显示全部楼层
手动添加地址规则!
http://out.XXXX.com/go-to?external_url=http://www.YYY.com/[参数]
实际连接:http://www.YYY.com/[参数]

应该是这样吧!
发表于 2011-3-18 11:45:30 | 显示全部楼层
先采集网址,再将网址保存出来,使用UltraEdit-32之类的软件替换就可以了

但多了一个人工的步骤
发表于 2011-3-18 21:07:17 | 显示全部楼层
加我QQ,免费教你
您需要登录后才可以回帖 登录 | 加入会员

本版积分规则

QQ|手机版|Archiver|火车采集器官方站 ( 皖ICP备06000549 )

GMT+8, 2025-7-20 07:55

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表