ninefox 发表于 2008-9-15 00:00:29

内容页中有多个div标签应该怎么采啊?

例:
<!-- 正文内容 begin -->
    <!-- google_ad_section_start -->
    <div class="blkContainerSblkCon" id="artibody">
   
   
   <div align="center"><img src="http://i3.sinaimg.cn/dy/c/2008-09-14/U2036P1T1D16287568F21DT20080914075817.jpg" border="1" alt="卢沟桥20年后再现“一天三月”美景(图)" style="border:1px solid #000;"></div><div class="f12" align="center" style="margin-top:5px;">“一天三月”奇景再现</div><br>   
   <p>  本报讯(记者王晴)昨晚8点,北京丰台区宛平城内月色朦胧,美丽的月亮倒映水中,更显明媚皎洁。站在卢沟桥上,市民已经可以欣赏到“一天三月”的旷世奇景了。 </p>
<p>  “卢沟晓月”是著名的燕京八景之一。古时乾隆皇帝曾在秋日路过卢沟桥,得此良辰美景,赋诗“半钩留照三秋淡,一练分波平镜明”于此,并题“卢沟晓月”,立碑于桥头。但随着时代变迁,北京的水资源相对匮乏,“卢沟晓月”的美景也因为晓月湖的干涸而消失长达20年之久。 </p>
<p>  2000年,政府曾努力恢复过晓月湖的水面,但最终还是因缺水而放弃,其间还尝试用高科技手段在湖畔制造人造月亮,却无法与“一天三月”的自然奇观媲美。 </p>
<p>  今年5月份,丰台区政府启动永定河的蓄水工程,工程中就包括恢复晓月湖水面。这次,恢复湖面采用的是南水北调工程中用来冲管道的废弃水,从今年7月1日开始注入晓月湖中。7月20日,随着南水北调京石段最后2万方冲管道弃水流入晓月湖,干了20年的卢沟晓月湖终于有了水波映月的条件,“卢沟晓月”奇观也得以在今年中秋佳节期间成功再现。
</p>

    </div>
    <!-- google_ad_section_end -->
    <!-- 正文内容 end -->
<br>
</div>   

--------------------------------------------------
内容标签如果设置为
开始字符串:<div class="blkContainerSblkCon" id="artibody">
结束字符串: </div>

这样的话就只能采到图片,因为在alt="卢沟桥20年后再现“一天三月”美景(图)" style="border:1px solid #000;"></div>这里就有一个</div>的结束字符串标志了,像这种代码里有多个div的情况,内容标签的规则该怎么写啊?

chenfy 发表于 2008-9-15 00:04:59

从<div class="blkContainerSblkCon" id="artibody">到 <!-- google_ad_section_end -->
就可以了

xiongyujie37 发表于 2008-9-15 02:05:32

汗。。。豆大的字。。。



<!-- 正文内容 begin -->





<!-- 正文内容 end -->



过滤DIV标签

xiongyujie37 发表于 2008-9-15 02:06:07

这个貌似是采集新浪吧。。。新浪全站 大部分都是这样的。。。

sengl 发表于 2008-9-15 06:19:34

看看基础教程吧

ninefox 发表于 2008-9-15 10:41:41

我晕,原来注释也可以当关键字
页: [1]
查看完整版本: 内容页中有多个div标签应该怎么采啊?