gs8716 发表于 2011-1-6 18:26:44

多页面循环采集问题

本帖最后由 gs8716 于 2011-1-7 09:26 编辑

举简单的例子:
A.html页面:<ul>
<li><a href="B/123.html">第一个</a>作者:xxx时间:0000</li>
<li><a href="B/456.html">第二个</a>作者:xxx时间:0000</li>
<li><a href="B/789.html">第三个</a>作者:xxx时间:0000</li>
</ul>注:B/userid.htmlurl重写之后的地址,B/123.html表示用户ID为123的用户中心页面

B页面:
包括作者的一些详细信息,比如 级别 等等

现在想要的结果是:
ID------作者-------时间-------级别等其它信息
123----XXX-------0000-----小学
456----XXX-------0000-----中学
789----xxx--------0000-----大学

我知道在定规则时要用到所属页面,在标签里勾选了循环复选,得到结果是
ID------作者-------时间-------级别等其它信息
123----XXX-------0000-----小学
456----XXX-------0000-----小学
789----xxx--------0000-----小学
其中最后一项永远都是ID为123的级别
是不是火车头不支持多页面循环采集?A页面记录循环,B页面地址可通过A页面循环的记录得到,当采集到A页面某条记录时,同时采集对应的B页面的相应的数据,B页面是动态传参得到不同内容的,B内容不循环每次得到的B页面内容不同。
页: [1]
查看完整版本: 多页面循环采集问题