|
|
需采集的页面源文件中代码(http://baike.baidu.com/view/54493.htm)
<a href=http://imgsrc.baidu.com/baike/pic/item/c71d0e385417bde1b211c7cc.jpg target="_blank"><img class=editorImg title="" src=http://imgsrc.baidu.com/baike/abpic/item/c71d0e385417bde1b211c7cc.jpg /></a>
这种格式的代码出现在我采集的标签内容中,已设置了下载图片,测试时是正确的,能下载a href链接的图片,也能下载img里的小图,同时这段代码在测试时输出为
<a href=OtherFile/20090925134544390.jpg target="_blank"><img class=editorImg title="" src=Image/20090925134543385.jpg /></a>
这是正确的结果,
但是正式采集时却只能下载img里的小图,实际发布的代码变为
<a href=http://imgsrc.baidu.com/baike/pic/item/c71d0e385417bde1b211c7cc.jpg target="_blank"><img class=editorImg title="" src=Image/20090925134543385.jpg /></a>
为什么会出现这种情况呢?是 bug还是免费版的限制???用的是2009sp3版
如何能像测试时那样下载大小图,图片的相关代码也本地化?请火车采集高手给指点下. |
|