sti01 发表于 2011-7-14 20:54:03

怎样从XML的子元素中采集数据

我在采集一个团购网站的数据
http://t.58.com/api/products
多数字段采集都正常
只是在采集“城市”的时候出现问题

XML数据的结构如下,每个城市有多个商品

<data>

<city>
        <id>2</id>
        <name>北京</name>
        <listname>bj</listname>
<product>
        <id>2891506678168</id>
        ...
</product>
<product>
        <id>2891506678168</id>
        ...
</product>
</city>       

<city>
        <id>4</id>
        <name>上海</name>
        <listname>sh</listname>       
<product>
        <id>2891506678168</id>
        ...
</product>
<product>
        <id>2891506678168</id>
        ...
</product>
</city>       
</data>


我希望在每个采集的商品记录里面都能把相应的城市名称加进来
但无论用<city>还是<name>做匹配字符串,都不成功。

有没有朋友知道,给个思路,谢谢了

303718 发表于 2011-7-15 10:00:33

按你说的就可以采集到呀。

sti01 发表于 2011-7-15 11:32:04

如果只采一条记录,用<name>就可以

但页面上的记录非常多
需要循环采集

城市的标签是<name>
商品名称的标签也是<name>
循环采集的结果就是混乱的
本该是城市名称的字段放了商品名称

星期天 发表于 2011-7-15 12:19:40

这个应该比较好弄吧

星期天 发表于 2011-7-15 12:20:22

这个应该比较好弄吧
星期天 发表于 2011-7-15 12:19 http://bbs.locoy.com/images/common/back.gif


    这个应该比较好弄吧
星期天 发表于 2011-7-15 12:19 http://bbs.locoy.com/images/common/back.gif


    ```````````````````````

星期天 发表于 2011-7-15 12:20:43

这个应该比较好弄吧
星期天 发表于 2011-7-15 12:19 http://bbs.locoy.com/images/common/back.gif


    ````````````````````````````````````````

sti01 发表于 2011-7-15 13:29:15

回复 6# 星期天
怎么弄,指导指导

303718 发表于 2011-7-15 13:42:32

你的意思要这样?

sti01 发表于 2011-7-15 20:58:43

只采城市肯定不行

我需要采商品
商品里面有个字段是城市
需要解决的问题是
怎样在循环采商品时,
加入正确的城市名称

商品有多个字段
城市名称只是其中之一
如图

流浪侠女 发表于 2011-7-16 09:48:49

规则是这样的:
<city>
                        <id>(*)</id>
                        <name>[参数]</name>
                        <listname>(*)</listname>       
                                                                                                <product>
                                <id>(*)</id>
                                <url>(*)</url>
                                <name>[参数]</name>

效果这样:
页: [1] 2
查看完整版本: 怎样从XML的子元素中采集数据