火车采集器软件交流官方论坛

 找回密码
 加入会员
搜索
火车采集器V9版免费下载火车浏览器 - 可视采集,万能群发,全自动脚本工具
查看: 4048|回复: 3

不采集不符合规则的文章

[复制链接]
发表于 2008-10-17 16:29:06 | 显示全部楼层 |阅读模式
比如 我要采集一个网站,发现那个网站文章内容页用了2个或多个不同的模板
我只设置了一个模板的采集规则,但其他模板的也会采集进去,达不到想要的效果!
希望能自动不采集那些与设置不符合的内容!
如我设置采集的内容是以 123qwe 开始 798zxc结尾 如果采集的时候发现内容里面没这两个东西就自动跳过不采集!
不知道是我没弄懂还是已经有这样的
发表于 2008-10-17 17:03:04 | 显示全部楼层
设置不采集的话在标签里选内容不能为空
 楼主| 发表于 2008-10-21 23:00:21 | 显示全部楼层
hao
谢谢 看来要加紧研究
发表于 2016-2-10 00:34:05 | 显示全部楼层
历史帖子回顾中。
您需要登录后才可以回帖 登录 | 加入会员

本版积分规则

QQ|手机版|Archiver|火车采集器官方站 ( 皖ICP备06000549 )

GMT+8, 2024-11-24 16:29

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表