|
在采集淘宝商品信息时,采集回来的数据多了"|||" 这个竖线,查看源文件中是没有的,这个是什么原因呀,如何去掉呢?我试过在排除中设置排除“|||”或“|”都不成功, 各位老大帮忙看下:
下面是我的采集网址:
默认页: http://taoke.alimama.com/spreader/gen_single_code.htm?auction_id=3852558766
分 页: http://item.taobao.com/auction/item_detail-0db2-afbcdd0a7253cfefa0919993fe066e92.jhtml
采集结果:- ████████████████████████████████████
- █此页面包含多个分页:
- █1:http://taoke.alimama.com/spreader/gen_single_code.htm?auction_id=3852558766
- █2:http://item.taobao.com/auction/item_detail-0db2-afbcdd0a7253cfefa0919993fe066e92.jhtml
- █有分页匹配的标签,比如内容注意选中标签编辑框中的[该标签在分页中匹配]
- ████████████████████████████████████
- 【商品地址】: http://item.taobao.com:80/auction/item_detail-0db2-afbcdd0a7253cfefa0919993fe066e92.jhtml
- 【店铺pid】: |||57024935
- 【略缩图】: |||http://img05.taobaocdn.com/bao/uploaded/i5/T1AZVoXkNjXXXu.jZ__080133.jpg_310x310.jpg
- 【用户数字id】: |||110630748
- 【店铺等级】: |||<a href="http://rate.taobao.com/user-rate-8ceeaf1554c58bb89a187e9c8c1f9c95.htm" target="_blank"><img src="http://pics.taobaocdn.com/newrank/s_blue_5.gif" border="0" align="absmiddle" class="rank" /></a>
- 【用户昵称】: |||fangbing_1985
- 【推广地址】: http://s.click.taobao.com/t_1?i=qzffcLvf5vrcnw%3D%3D&p=mm_10221486_0_0&n=11
- 【商品id】: afbcdd0a7253cfefa0919993fe066e92
- 【佣金】: 0.3
- 【产品描述】: 省略.........
- 【网店地址】: |||http://store.taobao.com/shop/view_shop-8ceeaf1554c58bb89a187e9c8c1f9c95.htm
- 【一口价】: 20.0
- 【佣金比率】: 1.5
- 【标题】: 杜拉拉升职记+华年似水全套 20元包邮
- 【所在地区】: |||上海
复制代码 |
|