438330601 发表于 2014-4-26 00:44:46

[求助]这样的源代码怎么采集

本帖最后由 438330601 于 2014-4-26 00:46 编辑

view-source:http://www.xrbrands.com/Merchant2/product/AD653.html


我主要是想采集var image_data6414 = [
{
"type_code":        "thumbnail",
"image_data":
[
"graphics\/00000001\/ad653-bulk_354x500.jpg",
"graphics\/00000001\/ad653-bulk_71x100.jpg",
"graphics\/00000001\/ad653-bulk.jpg"
]
}
,{
"type_code":        "",
"image_data":
[
"graphics\/00000001\/ad653-bulk-detail_410x500.jpg",
"graphics\/00000001\/ad653-bulk-detail_82x100.jpg",
"graphics\/00000001\/ad653-bulk-detail.jpg"
]
}
,{
"type_code":        "",
"image_data":
[
"graphics\/00000001\/ad653-pkg_329x500.jpg",
"graphics\/00000001\/ad653-pkg_66x100.jpg",
"graphics\/00000001\/ad653-pkg.jpg"
]
}
]
var im6414 = new ImageMachine( '\x41\x44\x36\x35\x33', 0, '\x6d\x61\x69\x6e\x5f\x69\x6d\x61\x67\x65', '\x74\x68\x75\x6d\x62\x6e\x61\x69\x6c\x73', '\x63\x6c\x6f\x73\x65\x75\x70\x5f\x64\x69\x76', '\x63\x6c\x6f\x73\x65\x75\x70\x5f\x69\x6d\x61\x67\x65', '\x63\x6c\x6f\x73\x65\x75\x70\x5f\x63\x6c\x6f\x73\x65', '', '\x42', 500, 500, 1, '\x42', 750, 750, 1, 100, 100, 0, '' );
im6414.oninitialize( image_data6414 );

主要是想采集那几张图片

303718 发表于 2014-4-26 10:15:38

跟普通内容采集一样的。用前后载取就行了呢

438330601 发表于 2014-4-26 10:27:19

303718 发表于 2014-4-26 10:15 static/image/common/back.gif
跟普通内容采集一样的。用前后载取就行了呢

请问下如果我只要采集每个image_data里的第一个地址那么应该怎么写规则,比如好像下面那样
graphics\/00000001\/ad653-bulk_354x500.jpg
graphics\/00000001\/ad653-bulk-detail_410x500.jpg
graphics\/00000001\/ad653-pkg_329x500.jpg",
还有我吧内容都替换了也无法下载到图片
请求页面 默认页 http://www.xrbrands.com/Merchant2/product/AD653.html


【SKU】:AD653
【标题】:CleanStream Thin Tip Silicone Enema Bulb AD653
【地址】:http://www.xrbrands.com/Merchant2/graphics/00000001/ad653-bulk_354x500.jpg

303718 发表于 2014-4-26 12:19:53

没有IMG标签的图片下载要购买收费版火车头采集器

438330601 发表于 2014-4-26 12:26:49

303718 发表于 2014-4-26 12:19 static/image/common/back.gif
没有IMG标签的图片下载要购买收费版火车头采集器

太感谢你了
还有一个问题
我吧内容都过滤成一下这个样子
ad699bulk-angle_750x628_500x419.jpg,/apple/ad699-model_472x750_315x500.jpg,/apple/ad699-pkg_648x750_432x500.jpg,/apple/ad699-bulk-detail_750x638_500x425.jpg,/apple/ad699-bulk_466x750_311x500.jpg,/apple/

我想把最后一个,/apple/过滤掉应该怎么写规则,是文章最后一个/apple/不是全部的,/apple/
页: [1]
查看完整版本: [求助]这样的源代码怎么采集