在采集内容规则里,使用”同时采集多页面“,怎样把采集到的地址添加上真实地址代码?
我要采的主页面里,有需要点击才弹出的新页面, 弹出的新页面有些需要采的信息,主页面地址:http://1x2.bet007.com/companyHistory.aspx?type=2&id=80&company=澳门&matchdate=2008-01-03
主页面弹出新页面的代码是这样的:
<td class="en"style="cursor:hand">1.06</td>
点击后,实际地址是:
http://1x2.bet007.com/OddsHistory.aspx?id=5900856&company=澳门&r1=巴塞隆拿&r2=艾高恩奴
在火车头的采集内容规则里,我使用了“同时采集多页面”,设置了“在默认页源代码内采集获得地址”
经过测试,可以采集获得以下地址:
5900856&company=澳门&r1=巴塞隆拿&r2=艾高恩奴
但是这个地址代码并没有添加真实地址代码:http://1x2.bet007.com/OddsHistory.aspx?id=
所以虽然设置了采集这个新页面的规则,但是实际上采不到新页面的内容,因为地址不对,真实地址代码http://1x2.bet007.com/OddsHistory.aspx?id= 并没有加上。
请教各位大大,怎么样在这个多页面采集的时候,可以把采集得到的地址代码 添加上 真实的地址代码?
先谢谢各位啦 :ali0ls
[ 本帖最后由 xiaoxb 于 2008-1-5 21:50 编辑 ] 教个很笨的办法
如果5900856这个值都是以59开头的话
在规则中使用“替换”
将59替换成http://1x2.bet007.com/OddsHistory.aspx?id=59即可
方法2直接打开mdb数据库替换即可 谢谢这位热心的朋友,不过那些值都是变化的,必须要从主页面采集提取的,没有规律的。奇怪了,这个论坛怎么代码贴不完全的?会自动屏蔽掉代码的?
还有啊,我不是要采网址,是要先采网址,然后得到页面采内容。
需要采主页面,然后从主页面得到新页面的网址,同时采新页面的内容
奇怪啊,代码贴不完全,被自动屏蔽了,怎么贴呢?
:(
<td class="en"style="cursor:hand">1.06</td>
<td class="en"style="cursor:hand">1.06</td>
[ 本帖最后由 xiaoxb 于 2008-1-5 21:57 编辑 ] 不知道啊.我也碰见了.采不行啊.
页:
[1]