火车采集器软件交流官方论坛

 找回密码
 加入会员
搜索
火车采集器V9版免费下载火车浏览器 - 可视采集,万能群发,全自动脚本工具
查看: 4347|回复: 11

怎样从XML的子元素中采集数据

[复制链接]
发表于 2011-7-14 20:54:03 | 显示全部楼层 |阅读模式
我在采集一个团购网站的数据
http://t.58.com/api/products
多数字段采集都正常
只是在采集“城市”的时候出现问题

XML数据的结构如下,每个城市有多个商品

<data>

<city>
        <id>2</id>
        <name>北京</name>
        <listname>bj</listname>
<product>
        <id>2891506678168</id>
        ...
</product>
<product>
        <id>2891506678168</id>
        ...
</product>
</city>       

<city>
        <id>4</id>
        <name>上海</name>
        <listname>sh</listname>       
<product>
        <id>2891506678168</id>
        ...
</product>
<product>
        <id>2891506678168</id>
        ...
</product>
</city>       
</data>


我希望在每个采集的商品记录里面都能把相应的城市名称加进来
但无论用<city>还是<name>做匹配字符串,都不成功。

有没有朋友知道,给个思路,谢谢了
发表于 2011-7-15 10:00:33 | 显示全部楼层
按你说的就可以采集到呀。

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?加入会员

x
 楼主| 发表于 2011-7-15 11:32:04 | 显示全部楼层
如果只采一条记录,用<name>就可以

但页面上的记录非常多
需要循环采集

城市的标签是<name>
商品名称的标签也是<name>
循环采集的结果就是混乱的
本该是城市名称的字段放了商品名称
发表于 2011-7-15 12:19:40 | 显示全部楼层
这个应该比较好弄吧
发表于 2011-7-15 12:20:22 | 显示全部楼层
这个应该比较好弄吧
星期天 发表于 2011-7-15 12:19



   
这个应该比较好弄吧
星期天 发表于 2011-7-15 12:19



    ```````````````````````
发表于 2011-7-15 12:20:43 | 显示全部楼层
这个应该比较好弄吧
星期天 发表于 2011-7-15 12:19



    ````````````````````````````````````````
 楼主| 发表于 2011-7-15 13:29:15 | 显示全部楼层
回复 6# 星期天
怎么弄,指导指导
发表于 2011-7-15 13:42:32 | 显示全部楼层
你的意思要这样?

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?加入会员

x
 楼主| 发表于 2011-7-15 20:58:43 | 显示全部楼层
只采城市肯定不行

我需要采商品
商品里面有个字段是城市
需要解决的问题是
怎样在循环采商品时,
加入正确的城市名称

商品有多个字段
城市名称只是其中之一
如图

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?加入会员

x
发表于 2011-7-16 09:48:49 | 显示全部楼层
规则是这样的:
<city>
                        <id>(*)</id>
                        <name>[参数]</name>
                        <listname>(*)</listname>       
                                                                                                <product>
                                <id>(*)</id>
                                <url>(*)</url>
                                <name>[参数]</name>

效果这样:

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?加入会员

x
您需要登录后才可以回帖 登录 | 加入会员

本版积分规则

QQ|手机版|Archiver|火车采集器官方站 ( 皖ICP备06000549 )

GMT+8, 2025-7-12 00:41

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表