火车采集器软件交流官方论坛

 找回密码
 加入会员
搜索
火车采集器V9版免费下载火车浏览器 - 可视采集,万能群发,全自动脚本工具
查看: 3636|回复: 3

在采集内容规则里,使用”同时采集多页面“,怎样把采集到的地址添加上真实地址代码?

[复制链接]
发表于 2008-1-5 21:15:53 | 显示全部楼层 |阅读模式
我要采的主页面里,有需要点击才弹出的新页面, 弹出的新页面有些需要采的信息,

主页面地址:http://1x2.bet007.com/companyHistory.aspx?type=2&id=80&company=澳门&matchdate=2008-01-03

主页面弹出新页面的代码是这样的:

<td class="en"  style="cursor:hand">1.06</td>

点击后,实际地址是:

http://1x2.bet007.com/OddsHistory.aspx?id=5900856&company=澳门&r1=巴塞隆拿&r2=艾高恩奴

在火车头的采集内容规则里,我使用了“同时采集多页面”,设置了“在默认页源代码内采集获得地址”

经过测试,可以采集获得以下地址:

5900856&company=澳门&r1=巴塞隆拿&r2=艾高恩奴

但是这个地址代码并没有添加真实地址代码:http://1x2.bet007.com/OddsHistory.aspx?id=

所以虽然设置了采集这个新页面的规则,但是实际上采不到新页面的内容,因为地址不对,真实地址代码http://1x2.bet007.com/OddsHistory.aspx?id= 并没有加上。

请教各位大大,怎么样在这个多页面采集的时候,可以把采集得到的地址代码 添加上 真实的地址代码?

先谢谢各位啦

[ 本帖最后由 xiaoxb 于 2008-1-5 21:50 编辑 ]
发表于 2008-1-5 21:24:25 | 显示全部楼层
教个很笨的办法
如果5900856这个值都是以59开头的话
在规则中使用“替换”
将59替换成http://1x2.bet007.com/OddsHistory.aspx?id=59即可

方法2直接打开mdb数据库替换即可
 楼主| 发表于 2008-1-5 21:48:20 | 显示全部楼层
谢谢这位热心的朋友,不过那些值都是变化的,必须要从主页面采集提取的,没有规律的。奇怪了,这个论坛怎么代码贴不完全的?会自动屏蔽掉代码的?

还有啊,我不是要采网址,是要先采网址,然后得到页面采内容。

需要采主页面,然后从主页面得到新页面的网址,同时采新页面的内容

奇怪啊,代码贴不完全,被自动屏蔽了,怎么贴呢?

<td class="en"  style="cursor:hand">1.06</td>

<td class="en"  style="cursor:hand">1.06</td>

[ 本帖最后由 xiaoxb 于 2008-1-5 21:57 编辑 ]
发表于 2008-7-13 08:29:41 | 显示全部楼层
不知道啊.我也碰见了.采不行啊.
您需要登录后才可以回帖 登录 | 加入会员

本版积分规则

QQ|手机版|Archiver|火车采集器官方站 ( 皖ICP备06000549 )

GMT+8, 2025-5-22 09:44

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表