|
本帖最后由 lz4594 于 2014-11-21 07:58 编辑
页面代码如下:
<div>
<span>房间1</span>
<ul>
<li>人员1</li>
<li>人员2</li>
<li>人员3</li>
</ul>
</div>
对于上述页面采集建立两个标签:【房间】、【人员】给以适当的数据提取规则,
对【人员】标签选择[该标签循环匹配],
并在[标签循环处理]中,勾选[添加为新纪录]、[循环不足的记录以第一条记录补全]。
采集测试结果如下:
【房间】:房间1
【人员】:人员1
███████████████第1条记录████████████████
【房间】:房间1
【人员】:人员2
███████████████第2条记录████████████████
【房间】:房间1
【人员】:人员3
███████████████第3条记录████████████████
结果正确。
可是实际情况遇到的是如下代码:
<div>
<span>房间1</span>
<ul>
<li>人员1</li>
<li>人员2</li>
<li>人员3</li>
</ul>
</div>
<div>
<span>房间2</span>
<ul>
<li>人员2-1</li>
<li>人员2-2</li>
<li>人员2-3</li>
</ul>
</div>
<div>
<span>房间3</span>
<ul>
<li>人员3-1</li>
<li>人员3-2</li>
<li>人员3-3</li>
</ul>
</div>
如果还依照原来采集方法,结果是:
【房间】:房间1
【人员】:人员1
███████████████第1条记录████████████████
【房间】:房间1
【人员】:人员2
███████████████第2条记录████████████████
【房间】:房间1
【人员】:人员3
███████████████第3条记录████████████████
【房间】:房间1
【人员】:人员2-1
███████████████第4条记录████████████████
【房间】:房间1
【人员】:人员2-2
███████████████第5条记录████████████████
【房间】:房间1
【人员】:人员2-3
███████████████第6条记录████████████████
【房间】:房间1
【人员】:人员3-1
███████████████第7条记录████████████████
【房间】:房间1
【人员】:人员3-2
███████████████第8条记录████████████████
【房间】:房间1
【人员】:人员3-3
███████████████第9条记录████████████████
不知道哪位高手能够给解答一下! |
|