my9011 发表于 2008-1-19 19:36:26

你好,帮忙我看看这个网站的分页怎么设置

你好,帮忙我看看这个网站的分页怎么设置,http://it.rising.com.cn/Channels/Anti_Virus/Upgrade_Report/2007-12-25/1198560262d44946.shtml想采集病毒摘要和技术细节

沦陷今生 发表于 2008-1-19 23:33:28

是这样的,这个问题关键在于处理多页面采集,楼主可以参考如下操作,已经成功分离页面。
典型页面:http://it.rising.com.cn/Channels/Anti_Virus/Upgrade_Report/2007-12-25/1198560262d44946.shtml
首先我使用的典型页面是 病毒摘要,我需要采集另一个技术细节页面,然后在同一页显示(楼主应该是这个意思吧,呵呵)
流程如下: 点采集内容规则--------添加标签--------点右上方的管理--------弹出一个添加同时采集页面--------在左边的空白列表处--------然后点右键选择重新添加--------页面名称:随意(我是技术细节)--------选择默认页源代码内取得采集地址
添加开始字符串:<LI><A id=current href="#">病毒摘要</A>
<LI><A href="
添加结束字符串:">技术细节</A>

可以测试一下,点下方的测试得到多页地址--填入当前病毒摘要地址-点测试-得到技术细节的地址。
如附件图:





最后回到标签页面,按照技术细节页面的源代码,过滤出内容标签就可以了。

[ 本帖最后由 沦陷今生 于 2008-1-19 23:35 编辑 ]
页: [1]
查看完整版本: 你好,帮忙我看看这个网站的分页怎么设置