版主来帮我看看呀
版主及各位大仙帮我看看那出问题了多页采集
页面源码:
<dd class="single_pro_name"><a target="_blank" href=" http://item.taobao.com/item.htm?id=9487757196 ">【今日包邮】925纯银项链 S925纯银紫水晶项链 柔美天使(含链)</a></dd>
9487757196 是页面变量
我为什么得不到9487757196 这个页面变量的值,我的设置有什么问题吗?
如果我设置成下面这样便可以采集
分页网址: [参数](*)
http://item.taobao.com/item.htm?id=9487757196
(其他不变)
========================下面是我的火车设置=========================
页面分页区域/样式设置
全部列出模式
从(*)
<dd class="single_pro_name"><a target="_blank" href="
到(*)
">
分页连接地址样式:[参数] (*)
http://item.taobao.com/item.htm?id=[参数]
分页网址: [参数](*)
http://item.taobao.com/item.htm?id=[参数1]
========================下面是我采集页面测试显示=======================
█此页面包含多个分页:
█1:http://taoke.alimama.com/spreader/gen_auction_code.htm?_tb_token_=e533b957e5073&auction_id=10001013186
█2:http://item.taobao.com/item.htm?id=
为什么上面这行 id= 后面是空白
█有分页匹配的标签,比如内容注意选中标签编辑框中的[该标签在分页中匹配]
http://item.taobao.com/item.htm?id=9487757196 这个地址实际就是内容页,请问您是要采集哪个多页? 本帖最后由 悠悠野云 于 2011-11-14 17:06 编辑
这个是阿里妈妈采集
整个结构
列表页
▼
推广网址页
▼
宝贝出售页(上面的就是这页)
▼
宝贝描述页(这页是采集目标)
以前的规则就是这样设置多页的,可用,就是不知道现在怎么不可以用了(代码有小的改变,上面是新代码) 我发现的以前的帖子,和我说一模一样
http://bbs.locoy.com/spider-54475-1-1.html
可惜没有答案,有哪位老大知道呀?说说吧!
页:
[1]