火车采集器软件交流官方论坛

 找回密码
 加入会员
搜索
火车采集器V9版免费下载火车浏览器 - 可视采集,万能群发,全自动脚本工具
查看: 1950|回复: 3

版主来帮我看看呀

[复制链接]
发表于 2011-11-14 01:15:26 | 显示全部楼层 |阅读模式
版主及各位大仙帮我看看那出问题了

多页采集
页面源码:
<dd class="single_pro_name"><a target="_blank" href=" http://item.taobao.com/item.htm?id=9487757196 ">【今日包邮】925纯银项链 S925纯银紫水晶项链 柔美天使(含链)</a></dd>

9487757196 是页面变量

我为什么得不到9487757196 这个页面变量的值,我的设置有什么问题吗?

如果我设置成下面这样便可以采集

分页网址:     [参数]  (*)
http://item.taobao.com/item.htm?id=9487757196
(其他不变)


========================下面是我的火车设置=========================

页面分页区域/样式设置
全部列出模式
从(*)
<dd class="single_pro_name"><a target="_blank" href="
到(*)
">

分页连接地址样式:[参数] (*)
http://item.taobao.com/item.htm?id=[参数]


分页网址:     [参数]  (*)
http://item.taobao.com/item.htm?id=[参数1]

========================下面是我采集页面测试显示=======================

█此页面包含多个分页:

█1:http://taoke.alimama.com/spreader/gen_auction_code.htm?_tb_token_=e533b957e5073&auction_id=10001013186

█2:http://item.taobao.com/item.htm?id=
        为什么上面这行 id= 后面是空白

█有分页匹配的标签,比如内容注意选中标签编辑框中的[该标签在分页中匹配]

发表于 2011-11-14 14:34:37 | 显示全部楼层
http://item.taobao.com/item.htm?id=9487757196 这个地址实际就是内容页,请问您是要采集哪个多页?
 楼主| 发表于 2011-11-14 17:04:55 | 显示全部楼层
本帖最后由 悠悠野云 于 2011-11-14 17:06 编辑

这个是阿里妈妈采集
整个结构

列表页
  ▼
推广网址页
  ▼
宝贝出售页(上面的就是这页)
  ▼
宝贝描述页(这页是采集目标)

以前的规则就是这样设置多页的,可用,就是不知道现在怎么不可以用了(代码有小的改变,上面是新代码)
 楼主| 发表于 2011-11-14 21:15:25 | 显示全部楼层
我发现的以前的帖子,和我说一模一样
http://bbs.locoy.com/spider-54475-1-1.html
可惜没有答案,有哪位老大知道呀?说说吧!
您需要登录后才可以回帖 登录 | 加入会员

本版积分规则

QQ|手机版|Archiver|火车采集器官方站 ( 皖ICP备06000549 )

GMT+8, 2024-10-6 18:27

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表