最新版本的采集网页上的图片有问题啊,2010版本的就没问题
采集网页,选择下载图片,其他没有特别的选择图片下载显示大小都是-1,
有时候又可以下载。。。。。。。。。。。。。。。
测试网页
http://jingyan.baidu.com/article/9f63fb91f0ef98c8400f0e03.html
可以写个规则,多下些数据,基本一半下载不下来
但用2010版本的,一点问题都没有。。。。。。。。。。。
这个严重了{:soso_e127:}
http://bbs.locoy.com/spider-130771-1-1.html
本帖最后由 caijihome 于 2012-10-12 15:27 编辑跟百度也有关系吧。
这个跟我以前反馈的应该接近。
火车头下载非真实图片地址 类型 图片 不会判断为真实格式。
http://bbs.locoy.com/spider-130771-1-1.html 本帖最后由 caijihome 于 2012-10-21 11:42 编辑
本帖最后由 caijihome 于 2012-10-21 11:42 编辑
{:soso_e165:} {:soso_e165:} {:soso_e165:} 本帖最后由 caijihome 于 2012-10-20 14:59 编辑
测试网址http://www.hermesoutletsstore.com/hermes-2012-waterproof-fabric-shoulder-bag-yellow_p4737.html
规则
好吧,还没解决,我接着反馈!
2010版本测试没问题!
这个图片下载也有问题,跟上面不一个情况。
我想知道我现在反馈的问题是什么导致的 这个问题是因为百度的图片服务器不支持head请求,所以导致采集器不能探测图片。
解决办法是把baidu的图片服务器的host添加到Configration下的FileDetect文件中,
比如imgsrc.baidu.com,不过百度图片服务器好像有点多,类似a. b.这样前缀的。
注意下 本帖最后由 caijihome 于 2012-10-17 14:41 编辑
caziyo 发表于 2012-10-17 13:55 static/image/common/back.gif
这个问题是因为百度的图片服务器不支持head请求,所以导致采集器不能探测图片。
解决办法是把baidu的图片服 ...
最后一个问题呢,外贸的。
你说的问题我早发现跟百度有关系了,我在前面加上自己域名就可以下载了,但是图片是ASP后缀。不是JPG格式呀。有些动态图片格式,下载下来不是图片格式的问题。
还有就是那个外贸站也帮看下,2个问题,谢谢!! 本帖最后由 caijihome 于 2012-10-21 12:06 编辑
第一,ASP或者PHP动态图片格式,下载之后变成ASP,PHP后缀了,本身就是图片。测试图片地址:
http://bbs.locoy.com/uc_server/avatar.php?uid=192218&size=middle
http://2uxi.vicp.cc/bug.php?picurl=http://1.su.bdimg.com/icon/7656.pnghttp://bbs.locoy.com/uc_server/avatar.php?uid=192218&size=middle
http://2uxi.vicp.cc/bug.php?picurl=http://1.su.bdimg.com/icon/7656.pnghttp://bbs.locoy.com/uc_server/avatar.php?uid=192218&size=middle
http://2uxi.vicp.cc/bug.php?picurl=http://1.su.bdimg.com/icon/7656.png
第二;上面那个外贸站没法下载图片
http://www.hermesoutletsstore.com/hermes-2012-waterproof-fabric-shoulder-bag-yellow_p4737.html
2个BUG caijihome 发表于 2012-10-16 14:47 static/image/common/back.gif
测试网址http://www.hermesoutletsstore.com/hermes-2012-waterproof-fabric-shoulder-bag-yellow_p4737.ht ...
测试不了啊,500错误
页:
[1]
2