火车采集器软件交流官方论坛

 找回密码
 加入会员
搜索
火车采集器V9版免费下载火车浏览器 - 可视采集,万能群发,全自动脚本工具
查看: 2224|回复: 3

求教如何采集真实url

[复制链接]
发表于 2011-10-23 19:58:53 | 显示全部楼层 |阅读模式
我用火车头采集了一组url,不过这组url 是短地址,请教各位大大,如何采集这组短地址的真实url?
谢谢赐教!
发表于 2011-10-23 20:21:01 | 显示全部楼层
你在这组短地址的前面加上这个网站的域名试一试?
比如你采集到的短地址是:
  1. /abc/def.html
复制代码
该网站的域名是:
  1. http://www.xxx.com
复制代码
然后用正则匹配内容里把“/abc/def.html”改成成“参数”,在输出结果中写成“http://www.xxx.com参数1”估计就差不多了吧!

这也是我下午刚弄懂的!
 楼主| 发表于 2011-10-23 20:41:48 | 显示全部楼层
unithree 发表于 2011-10-23 20:21
你在这组短地址的前面加上这个网站的域名试一试?
比如你采集到的短地址是:该网站的域名是:然后用正则匹配 ...

谢谢楼上这么快回复,不过可能我没有表达清楚,我的意思是我采集到的列表是 类似http://bit.ly/uori

的地址,或者说是一组跳转的url,如何继续采集这组跳转url的真实url

比如
http://bit.ly/uori  是我采集到的列表,它跳转到baidu.com

其实我真正要采集的是baidu.com,如何实现这个效果呢?
发表于 2011-10-23 20:49:38 | 显示全部楼层
wsapple2001 发表于 2011-10-23 20:41
谢谢楼上这么快回复,不过可能我没有表达清楚,我的意思是我采集到的列表是 类似http://bit.ly/uori

的 ...

这个不好说,要把它源代码拿出来看才知道!
您需要登录后才可以回帖 登录 | 加入会员

本版积分规则

QQ|手机版|Archiver|火车采集器官方站 ( 皖ICP备06000549 )

GMT+8, 2024-10-6 08:32

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表