xiaoxb 发表于 2008-1-5 21:15:53

在采集内容规则里,使用”同时采集多页面“,怎样把采集到的地址添加上真实地址代码?

我要采的主页面里,有需要点击才弹出的新页面, 弹出的新页面有些需要采的信息,

主页面地址:http://1x2.bet007.com/companyHistory.aspx?type=2&id=80&company=澳门&matchdate=2008-01-03

主页面弹出新页面的代码是这样的:

<td class="en"style="cursor:hand">1.06</td>

点击后,实际地址是:

http://1x2.bet007.com/OddsHistory.aspx?id=5900856&company=澳门&r1=巴塞隆拿&r2=艾高恩奴

在火车头的采集内容规则里,我使用了“同时采集多页面”,设置了“在默认页源代码内采集获得地址”

经过测试,可以采集获得以下地址:

5900856&company=澳门&r1=巴塞隆拿&r2=艾高恩奴

但是这个地址代码并没有添加真实地址代码:http://1x2.bet007.com/OddsHistory.aspx?id=

所以虽然设置了采集这个新页面的规则,但是实际上采不到新页面的内容,因为地址不对,真实地址代码http://1x2.bet007.com/OddsHistory.aspx?id= 并没有加上。

请教各位大大,怎么样在这个多页面采集的时候,可以把采集得到的地址代码 添加上 真实的地址代码?

先谢谢各位啦 :ali0ls

[ 本帖最后由 xiaoxb 于 2008-1-5 21:50 编辑 ]

ralen 发表于 2008-1-5 21:24:25

教个很笨的办法
如果5900856这个值都是以59开头的话
在规则中使用“替换”
将59替换成http://1x2.bet007.com/OddsHistory.aspx?id=59即可

方法2直接打开mdb数据库替换即可

xiaoxb 发表于 2008-1-5 21:48:20

谢谢这位热心的朋友,不过那些值都是变化的,必须要从主页面采集提取的,没有规律的。奇怪了,这个论坛怎么代码贴不完全的?会自动屏蔽掉代码的?

还有啊,我不是要采网址,是要先采网址,然后得到页面采内容。

需要采主页面,然后从主页面得到新页面的网址,同时采新页面的内容

奇怪啊,代码贴不完全,被自动屏蔽了,怎么贴呢?
:(
<td class="en"style="cursor:hand">1.06</td>

<td class="en"style="cursor:hand">1.06</td>

[ 本帖最后由 xiaoxb 于 2008-1-5 21:57 编辑 ]

52computer 发表于 2008-7-13 08:29:41

不知道啊.我也碰见了.采不行啊.
页: [1]
查看完整版本: 在采集内容规则里,使用”同时采集多页面“,怎样把采集到的地址添加上真实地址代码?