火车采集器软件交流官方论坛

 找回密码
 加入会员
搜索
火车采集器V9版免费下载火车浏览器 - 可视采集,万能群发,全自动脚本工具
查看: 3291|回复: 5

内容页中有多个div标签应该怎么采啊?

[复制链接]
发表于 2008-9-15 00:00:29 | 显示全部楼层 |阅读模式
例:
<!-- 正文内容 begin -->
    <!-- google_ad_section_start -->
    <div class="blkContainerSblkCon" id="artibody">
     
     
     <div align="center"><img src="http://i3.sinaimg.cn/dy/c/2008-09-14/U2036P1T1D16287568F21DT20080914075817.jpg" border="1" alt="卢沟桥20年后再现“一天三月”美景(图)" style="border:1px solid #000;"></div><div class="f12" align="center" style="margin-top:5px;">“一天三月”奇景再现</div><br>   
     <p>  本报讯(记者王晴)昨晚8点,北京丰台区宛平城内月色朦胧,美丽的月亮倒映水中,更显明媚皎洁。站在卢沟桥上,市民已经可以欣赏到“一天三月”的旷世奇景了。 </p>
<p>  “卢沟晓月”是著名的燕京八景之一。古时乾隆皇帝曾在秋日路过卢沟桥,得此良辰美景,赋诗“半钩留照三秋淡,一练分波平镜明”于此,并题“卢沟晓月”,立碑于桥头。但随着时代变迁,北京的水资源相对匮乏,“卢沟晓月”的美景也因为晓月湖的干涸而消失长达20年之久。 </p>
<p>  2000年,政府曾努力恢复过晓月湖的水面,但最终还是因缺水而放弃,其间还尝试用高科技手段在湖畔制造人造月亮,却无法与“一天三月”的自然奇观媲美。 </p>
<p>  今年5月份,丰台区政府启动永定河的蓄水工程,工程中就包括恢复晓月湖水面。这次,恢复湖面采用的是南水北调工程中用来冲管道的废弃水,从今年7月1日开始注入晓月湖中。7月20日,随着南水北调京石段最后2万方冲管道弃水流入晓月湖,干了20年的卢沟晓月湖终于有了水波映月的条件,“卢沟晓月”奇观也得以在今年中秋佳节期间成功再现。
</p>

    </div>
    <!-- google_ad_section_end -->
    <!-- 正文内容 end -->
  <br>
</div>   

--------------------------------------------------
内容标签如果设置为
开始字符串:  <div class="blkContainerSblkCon" id="artibody">
结束字符串: </div>

这样的话就只能采到图片,因为在  alt="卢沟桥20年后再现“一天三月”美景(图)" style="border:1px solid #000;"></div>  这里就有一个</div>的结束字符串标志了,像这种代码里有多个div的情况,内容标签的规则该怎么写啊?
发表于 2008-9-15 00:04:59 | 显示全部楼层
从<div class="blkContainerSblkCon" id="artibody">  到 <!-- google_ad_section_end -->
就可以了
发表于 2008-9-15 02:05:32 | 显示全部楼层
汗。。。豆大的字。。。



<!-- 正文内容 begin -->





<!-- 正文内容 end -->



过滤DIV标签
发表于 2008-9-15 02:06:07 | 显示全部楼层
这个貌似是采集新浪吧。。。新浪全站 大部分都是这样的。。。
发表于 2008-9-15 06:19:34 | 显示全部楼层
看看基础教程吧
 楼主| 发表于 2008-9-15 10:41:41 | 显示全部楼层
我晕,原来注释也可以当关键字
您需要登录后才可以回帖 登录 | 加入会员

本版积分规则

QQ|手机版|Archiver|火车采集器官方站 ( 皖ICP备06000549 )

GMT+8, 2026-4-21 13:21

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表