sun88888 发表于 2010-6-3 10:27:48

能不能排除某些有特定内容的网址呢?

采集到的网址里有些页面含有“企业介绍”四个字,现在想排除这些网页,但是采集器只有“内容网址里不得包含”的可添项,没有网页内容不得包含的项目,怎么排除呢,注明:从网址里分辨不出来 例如:http://www.xxxxx.com/(数字).htm,都一个形式

yzimhao 发表于 2010-6-3 10:27:49

是可以排除的   

可以添加标签中不得包含 的关键字

sun88888 发表于 2010-6-3 14:22:30

虽然不能直接解决,但顺着你的指引找到了答案。
页: [1]
查看完整版本: 能不能排除某些有特定内容的网址呢?