topirol 发表于 2012-4-6 23:23:49

请问:一个页面存在多条记录,应该如何采集?

一个页面源代码为:
<ul>
<li>
<span>小说名称:名字1</span>
<span>简介:简介内容</span>
<a href='链接1'>阅读地址1</a>
<a href='链接2'>阅读地址2</a>
</li>
<li>
<span>小说名称:名字2</span>
<span>简介:简介内容</span>
<a href='链接1'>阅读地址1</a>
<a href='链接2'>阅读地址2</a>
<a href='链接3'>阅读地址3</a>
</li>
<li>
<span>小说名称:名字3</span>
<span>简介:简介内容</span>
<a href='链接1'>阅读地址1</a>
</li>
</ul>

我想每一个<li></li>为一条记录,分别采集“小说名称","简介","阅读地址",其中“阅读地址”有多个的用$$$隔开"链接1$$$链接2"

请问用火车头能采集吗?一个页面存在多条记录,应该如何采集,轻高手指点指点,谢谢!

topirol 发表于 2012-4-7 01:14:19

这涉及到两个循环匹配的问题,其中一个循环匹配(小说名称)是添加为新记录,另外一个循环匹配(阅读地址)是用分隔符连接。我用V7只能采集到第一个,但阅读地址只有1个,其他的记录,只有“小说名称”,其他为空,,,:Q

topirol 发表于 2012-4-10 20:11:43

唉,没人指点下吗?
页: [1]
查看完整版本: 请问:一个页面存在多条记录,应该如何采集?