xiongyujie37 发表于 2007-12-25 00:48:21

菜鸟采集问题,求解 先谢谢大家的解答

采集源地址   http://mil.jschina.com.cn/Get/MIWEN/08290910976.htm


采集规则的设定:


标题 设置

开始 <TITLE>

结束 </TITLE>

过滤 排除                  鼎盛军事   --   (www.top81.com.cn)

正文设置

开始         录入时间

结束          来源:

过滤排除   来源:   200(*)

全局过滤掉 框架 JS 超链接


在此实例中 正文只采集回来一个时间,求解


再次谢谢大家

[ 本帖最后由 xiongyujie37 于 2007-12-25 23:54 编辑 ]

xiongyujie37 发表于 2007-12-25 00:53:03

我设置错误在哪里呢?

谢谢您对本问题的解答

sushy 发表于 2007-12-25 03:35:35

正文开始   :         <DIV align=left>
正文结束 :         </DIV>

xiongyujie37 发表于 2007-12-25 18:44:32

谢谢你 可是我还是不明白我错误在哪里

你写的很好,真的

sushy 发表于 2007-12-25 19:45:03

火车头采集要求特征采集,既然有更明显的 唯一 特征符,你何必采集那么多,再过滤呢?

要是像你这样,你可以不用限制开始和结束,把一整页全部采集回来,然后再慢慢去特征符,那样更爽。

建议你先补补基础,一眼就看出来的东西,何必再问?

xiongyujie37 发表于 2007-12-25 23:53:36

哦谢谢! 版主给楼上加分吧 问题解决
页: [1]
查看完整版本: 菜鸟采集问题,求解 先谢谢大家的解答