|
|
一个页面源代码为:
<ul>
<li>
<span>小说名称:名字1</span>
<span>简介:简介内容</span>
<a href='链接1'>阅读地址1</a>
<a href='链接2'>阅读地址2</a>
</li>
<li>
<span>小说名称:名字2</span>
<span>简介:简介内容</span>
<a href='链接1'>阅读地址1</a>
<a href='链接2'>阅读地址2</a>
<a href='链接3'>阅读地址3</a>
</li>
<li>
<span>小说名称:名字3</span>
<span>简介:简介内容</span>
<a href='链接1'>阅读地址1</a>
</li>
</ul>
我想每一个<li></li>为一条记录,分别采集“小说名称","简介","阅读地址",其中“阅读地址”有多个的用$$$隔开"链接1$$$链接2"
请问用火车头能采集吗?一个页面存在多条记录,应该如何采集,轻高手指点指点,谢谢! |
|