找回密码

火车采集器软件交流官方论坛

搜索
火车采集器V9版免费下载火车浏览器 - 可视采集,万能群发,全自动脚本工具
查看: 3380|回复: 4

多页面循环采集问题

[复制链接]
发表于 2011-1-7 09:27:09 | 显示全部楼层 |阅读模式
1火车车厢
举简单的例子:
A.html页面:
  1. <ul>
  2. <li><a href="B/123.html">第一个</a>作者:xxx时间:0000</li>
  3. <li><a href="B/456.html">第二个</a>作者:xxx时间:0000</li>
  4. <li><a href="B/789.html">第三个</a>作者:xxx时间:0000</li>
  5. </ul>
复制代码
注:B/userid.html  url重写之后的地址,B/123.html表示用户ID为123的用户中心页面

B页面:
包括作者的一些详细信息,比如 级别 等等

现在想要的结果是:
ID------作者-------时间-------级别等其它信息
123----XXX-------0000-----小学
456----XXX-------0000-----中学
789----xxx--------0000-----大学

我知道在定规则时要用到所属页面,在标签里勾选了循环复选,得到结果是
ID------作者-------时间-------级别等其它信息
123----XXX-------0000-----小学
456----XXX-------0000-----小学
789----xxx--------0000-----小学
其中最后一项永远都是ID为123的级别
求指点啊!!!!帮我解决问题的奖1节车厢
是不是火车头不支持多页面循环采集?A页面记录循环,B页面地址可通过A页面循环的记录得到,当采集到A页面某条记录时,同时采集对应的B页面的相应的数据,B页面是动态传参得到不同内容的,B内容不循环每次得到的B页面内容不同。

 楼主| 发表于 2011-1-7 10:46:55 | 显示全部楼层
这么久了还没有人回复,哎,求助啊!
 楼主| 发表于 2011-1-7 13:01:14 | 显示全部楼层
回复 3# 303718

列表页面是
    http://tieba.baidu.com/f?kw=%BF%D5%BC%E4%CB%D8%B2%C4  带分页
帖子详细页面A是
  上面列表中每条记录,比如:http://tieba.baidu.com/f?kz=971052707
B页面是A页面通过用户名那个链接而来的

采集的是A页面的用户名、帖子内容,B页面的吧豆消费数,现在是只能匹配第一个用户的数目,其它的都是第一个用户的,也就是重复。
发表于 2011-1-7 16:27:35 | 显示全部楼层
搞一下午了,还没搞定,主要问题有:
1.火车不能在采网址阶段实现分页获取地址
2.火车导出的TXT文件都会有前缀,比如"标题: aaa",缩略那几个字也很讨厌
3.用神采好像可以做采多页网址的功能,但我不会用,没看过神采的教程,用起来吐血

真希望哪个牛人出来搞一下....
发表于 2011-1-8 10:29:04 | 显示全部楼层
实在不行可以接口处理
您需要登录后才可以回帖 登录 | 加入会员

本版积分规则

温馨提示:建议您联系官方定制服务,通过官方支付方式完成支付。您与其他非官方账号发生的交易,我方概不承担责任。网络有风险,交易需谨慎

QQ| 手机版|Archiver| 火车采集器官方站

Copyright © 2001-2013 Comsenz Inc.  Template by Comeings! All Rights Reserved.

Powered by Discuz! X3.4( 皖ICP备06000549 )

快速回复 返回顶部 返回列表