急``帖子重复发!怎么设置包含与不包含?
刚刚在采集别站的内容,那个站本来只有1155站主题,但采到我这却1406还没停``还在采``我觉得不对劲,就去搜索下看会不会重复,一看晕了``一主题超过3个以上重复``在论坛查了下``好象是跟设置文章页面地址包含与不包含有关``
我要采集的地址是:http://www.itadmin.cn/admin/shopguide/management/Index.html
文章地址:http://www.itadmin.cn/admin/2006/37246.html
大家能告诉我包含是哪个,不包含是哪个吗?
还有怎么看包含与不包含,我对这概念很模糊,不懂啊`` 包含就是这个网址中必须包含这个字符 多个用(*)分隔
不包含就是这个网址中不得包含这个字符 多个用|分隔 http://www.itadmin.cn/admin/2006/37246.html
那像这个地址怎么弄``
算是给个例子以后就懂了``:ali0ls 重复地址应该不会采到吧 但今天不知道怎么采集后会重复
那个站本来只有1155站主题,但采到我这却1406还没停``还在采``我觉得不对劲,就去搜索下看会不会重复,一看晕了``一主题超过3个以上重复``
页:
[1]