悠悠野云 发表于 2011-11-14 01:15:26

版主来帮我看看呀

版主及各位大仙帮我看看那出问题了

多页采集
页面源码:
<dd class="single_pro_name"><a target="_blank" href=" http://item.taobao.com/item.htm?id=9487757196 ">【今日包邮】925纯银项链 S925纯银紫水晶项链 柔美天使(含链)</a></dd>

9487757196 是页面变量

我为什么得不到9487757196 这个页面变量的值,我的设置有什么问题吗?

如果我设置成下面这样便可以采集

分页网址:   [参数](*)
http://item.taobao.com/item.htm?id=9487757196
(其他不变)


========================下面是我的火车设置=========================

页面分页区域/样式设置
全部列出模式
从(*)
<dd class="single_pro_name"><a target="_blank" href="
到(*)
">

分页连接地址样式:[参数] (*)
http://item.taobao.com/item.htm?id=[参数]


分页网址:   [参数](*)
http://item.taobao.com/item.htm?id=[参数1]

========================下面是我采集页面测试显示=======================

█此页面包含多个分页:

█1:http://taoke.alimama.com/spreader/gen_auction_code.htm?_tb_token_=e533b957e5073&auction_id=10001013186

█2:http://item.taobao.com/item.htm?id=
      为什么上面这行 id= 后面是空白

█有分页匹配的标签,比如内容注意选中标签编辑框中的[该标签在分页中匹配]

wxl08 发表于 2011-11-14 14:34:37

http://item.taobao.com/item.htm?id=9487757196 这个地址实际就是内容页,请问您是要采集哪个多页?

悠悠野云 发表于 2011-11-14 17:04:55

本帖最后由 悠悠野云 于 2011-11-14 17:06 编辑

这个是阿里妈妈采集
整个结构

列表页

推广网址页

宝贝出售页(上面的就是这页)

宝贝描述页(这页是采集目标)

以前的规则就是这样设置多页的,可用,就是不知道现在怎么不可以用了(代码有小的改变,上面是新代码)

悠悠野云 发表于 2011-11-14 21:15:25

我发现的以前的帖子,和我说一模一样
http://bbs.locoy.com/spider-54475-1-1.html
可惜没有答案,有哪位老大知道呀?说说吧!
页: [1]
查看完整版本: 版主来帮我看看呀