菜鸟采集问题,求解 先谢谢大家的解答
采集源地址 http://mil.jschina.com.cn/Get/MIWEN/08290910976.htm采集规则的设定:
标题 设置
开始 <TITLE>
结束 </TITLE>
过滤 排除 鼎盛军事 -- (www.top81.com.cn)
正文设置
开始 录入时间
结束 来源:
过滤排除 来源: 200(*)
全局过滤掉 框架 JS 超链接
在此实例中 正文只采集回来一个时间,求解
再次谢谢大家
[ 本帖最后由 xiongyujie37 于 2007-12-25 23:54 编辑 ] 我设置错误在哪里呢?
谢谢您对本问题的解答 正文开始 : <DIV align=left>
正文结束 : </DIV> 谢谢你 可是我还是不明白我错误在哪里
你写的很好,真的 火车头采集要求特征采集,既然有更明显的 唯一 特征符,你何必采集那么多,再过滤呢?
要是像你这样,你可以不用限制开始和结束,把一整页全部采集回来,然后再慢慢去特征符,那样更爽。
建议你先补补基础,一眼就看出来的东西,何必再问? 哦谢谢! 版主给楼上加分吧 问题解决
页:
[1]