兄弟们帮帮忙,分页采集,一分页就采集不到内容,跪求大侠伸出缓手
我用的是火车3.2的版本采集的网页:http://www.525j.com.cn/html/design/093315205632044.shtml
没有分页的情况内容可以采集到,一旦有分页,内容就采集不到了,我的设置图片如下,
小弟试了很多方法都不行,兄弟们帮帮忙,看问题在哪里,跪谢大家 你可以这样试验下
开始标签<font color="red">
结束标签 </div>
这个是分页那里设置的 选择全部列出
你再看下 规则贴出来啊。帅哥。有助于速度破案 图上有的,一页能显示 的,一多页就不行了,大家再帮忙看看 2# 专业收费采集
我图上就是按你的这样设计的,多页就不行了 2楼的可以啊 你的多出了一些符号 兄弟,二楼的也不行哪,我试过了,删除掉前面的空格符号也不行的,我现在换成了2009版本的,显示 以下,大家再帮帮忙看下问题在哪里,理论上应该可以,但就是不行,见鬼了:
████████████████████████████████████
█此页面包含多个分页:
█1:http://www.525j.com.cn/html/design/093315205632044.shtml
█2:http://www.525j.com.cn/html/design/093315205632044_2.shtml
█3:http://www.525j.com.cn/html/design/093315205632044_3.shtml
█4:http://www.525j.com.cn/html/design/093315205632044_4.shtml
█有分页匹配的标签,比如内容注意选中标签编辑框中的[该标签在分页中匹配]
████████████████████████████████████
【作者】: <a href="http://www.locoy.com" target="_blank">火车采集器</a>
【出处】:
【标题】: 小户型装修风格迥异 哪一种是你的最爱
【内容】:
★★★--内容标签设置采集结果不得为空,自动过滤该条记录。--★★★ 本帖最后由 weiww 于 2009-3-6 06:03 编辑
goto=findpost&pid=214477&ptid=36067]8# weiww
搞了一晚终于好了,把3.2的升级到2009正式版, 电脑死机,重新启动电脑,就好了
经验总结:多试,试到电脑撑不住的时候,胜利的曙光就来了,天亮了,买早餐去了
另外说个事: 3.2版本的升级到2009的时候,全局变量要重新设置,原旧版标题、内容标签中你设置了为空过率的时候,新版本中你要再点一下,就是去掉了再沟上,免得空的东西也给你采集进来,经验共享,谢谢大家帮我 ali55ls<div align="right">本新闻共
页:
[1]
2