西狂曲 发表于 2007-1-9 07:06:26

这样的代码如何采集?请高手指点

在要采集的正文内容中包含了图片,但是图片是相对地址,发现火车头采集不了,比如下例的正文:

<table width="416" border="0"><tr><td><table cellpadding="0" cellspacing="0" border="0" align="right" width="208"><tr><td bgcolor="#FFFFFF" rowspan="2"><img src="http://www.bbc.co.uk/f/t.gif" width="5" height="1" border="0" alt=""></td><td><div><img src="/worldservice/images/2006/02/20060224122127helen_and_zoe_top.jpg" width="203" height="152" alt="Helen Hu and Zoe Liu"></div></td></tr><tr><td class="caption">Do you get perks with your job?</td></tr></table><!-- st_story --><div class="storytext"><b>Helen:</b> Hello, welcome to Real English from BBC Learning English. I’m Helen.</div><p class="storytext"><b>Zoe:</b>

请问对于上面这段正文内容,相对路径的IMG(兰色加粗部分)该如何写规则呢?非常感谢

tianyuxuan 发表于 2007-1-11 11:11:00

可以使用替换啊

具体操作:

内容标签-------------内容替换

/worldservice/images/ -----------=http://www.bbc.co.uk/worldservice/images/

这样就可以了
页: [1]
查看完整版本: 这样的代码如何采集?请高手指点