火车采集器软件交流官方论坛

 找回密码
 加入会员
搜索
火车采集器V9版免费下载火车浏览器 - 可视采集,万能群发,全自动脚本工具
查看: 1543|回复: 3

采集内容返回为空怎么过滤掉呢?

[复制链接]
发表于 2008-12-11 01:58:07 | 显示全部楼层 |阅读模式
比如我采集
http://123456.com/show.php?id=1111
http://123456.com/show.php?id=2222
id=1111这个地址是没有内容的,但是网页不报错也不返回404页面,就是一个空页面
id=2222这个地址是有内容的。
这样在采集的时候1111这个页面还是能够采集到。当然就能发布出去了。但是内容是为空的。。。。。

这个怎么解决呢???
发表于 2008-12-11 03:45:50 | 显示全部楼层
比如我采集
http://123456.com/show.php?id=1111
http://123456.com/show.php?id=2222
id=1111这个地址是没有内容的,但是网页不报错也不返回404页面,就是一个空页面
id=2222这个地址是有内容的。
这样在采集的时候1111这个页面还是能够采集到。当然就能发布出去了。但是内容是为空的。。。。。

什么?
1111这个页面不是没有内容吗?》
你还怎么采集的到?
如果你说的是列表页
那就在文章内容页面必须包含 旁边的不得包含 里面填写1111
这样有1111这个四个数字 就不可以采集
发表于 2008-12-11 03:47:20 | 显示全部楼层
id=1111
发表于 2008-12-11 08:48:18 | 显示全部楼层
内容标签不得为空,勾上

评分

1

查看全部评分

您需要登录后才可以回帖 登录 | 加入会员

本版积分规则

企业微信|手机版|Archiver|火车采集器官方站 ( 皖ICP备06000549 )

GMT+8, 2026-4-23 17:28

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表