火车采集器软件交流官方论坛

 找回密码
 加入会员
搜索
火车采集器V9版免费下载火车浏览器 - 可视采集,万能群发,全自动脚本工具
查看: 5369|回复: 6

手动填写链接地址规则,测试出来,每行有两个Http地址,请赐教

[复制链接]
发表于 2010-11-2 10:33:18 | 显示全部楼层 |阅读模式
本帖最后由 kristycj 于 2010-11-2 11:18 编辑

这是脚本规则:<li><a href="[参数]" target="_blank">(*)</a><span>((*))</span></li>
这是实际连接地址:http://news.sina.com.cn/w/p/2010-11-01/[参数1]


采网址的时候,网址是正常的:
类似:http://video.sina.com.cn/p/news/w/v/2010-10-24/140661165859.html

但采内容的时候,就出现了两个http,是什么情况呢?
http://news.sina.com.cn/w/p/2010-11-01http://news.sina.com.cn/w/2010-10-26/143421355031.shtml  就有两个Http地址,这是什么问题呢?如何解决???急。。谢谢大侠们了………………
发表于 2010-11-2 11:26:48 | 显示全部楼层
<li><a href="[参数]"                [参数1]
 楼主| 发表于 2010-11-2 11:36:01 | 显示全部楼层
回复 2# zhouchanglin 没看明白……您能说详细点么?
发表于 2010-11-2 11:39:42 | 显示全部楼层
回复 3# kristycj


    你把要采集的网址发下啊
 楼主| 发表于 2010-11-2 11:52:19 | 显示全部楼层
回复 4# zhouchanglin http://roll.news.sina.com.cn/news/gjxw/hqqw/index.shtml这是我要采集的网址
发表于 2010-11-2 11:54:42 | 显示全部楼层
实际链接地址 直接填  [参数1]
http://news.sina.com.cn/w/p/2010-11-01/给删除掉,不需要的,官方的火车可以自动补全地址
发表于 2010-11-2 12:09:58 | 显示全部楼层
<li><a href="[参数]"                [参数1]

就行了,自定义网址实际是用参数组合成需要的地址,你写的,例<li><a href="http://news.sina.com.cn/w/2010-10-22/162321332592.shtml" target="_blank">俄罗斯总统在微博上祝贺女大学生生日</a><span>(10月22日 16:23)</span></li>这段里根据你写的规则,参数部分获得http://news.sina.com.cn/w/2010-10-22/162321332592.shtml,作为参数1,再与http://news.sina.com.cn/w/p/2010-11-01/组合,这样等到的实际网址不就是http://news.sina.com.cn/w/p/2010 ... /162321332592.shtml了,当然不是正确的地址。

<li><a href="[参数]"                [参数1]
,这样获得的参数里的信息就是实际想要的地址了,所以这样写,就是用获取到的参数组合成想要的东西
您需要登录后才可以回帖 登录 | 加入会员

本版积分规则

QQ|手机版|Archiver|火车采集器官方站 ( 皖ICP备06000549 )

GMT+8, 2025-7-12 20:04

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表