xiaogougou 发表于 2009-2-26 12:25:35

为什么每个列表页的内容都一样呢

本帖最后由 xiaogougou 于 2009-2-26 12:32 编辑

比如这个页面,
http://www.anjia.com/sh/house/search_list.jsp?action=returnPage¤tPage=4
我采集的时候。。
http://www.anjia.com/sh/house/search_list.jsp?action=returnPage¤tPage=(*)
这个规则没错,
页面必须包含:
http://www.anjia.com/house/20(*).shtm
但是。。采集出来的结果都是

采网址--重复,该网址在站点地址库中存在:http://www.anjia.com/house/200801255714947.shtm
采网址--重复,该网址在站点地址库中存在:http://www.anjia.com/house/200810300515793.shtm
采网址--重复,该网址在站点地址库中存在:http://www.anjia.com/house/200801255815059.shtm
采网址--重复,该网址在站点地址库中存在:http://www.anjia.com/house/20080123399047.shtm#
采网址--重复,该网址在站点地址库中存在:http://www.anjia.com/house/200801255715004.shtm
采网址--重复,该网址在站点地址库中存在:http://www.anjia.com/house/200801255714982.shtm
采网址--重复,该网址在站点地址库中存在:http://www.anjia.com/house/200802012015311.shtm
采网址--重复,该网址在站点地址库中存在:http://www.anjia.com/house/200803145015640.shtm
采网址--重复,该网址在站点地址库中存在:http://www.anjia.com/house/200810301415796.shtm
采网址--重复,该网址在站点地址库中存在:http://www.anjia.com/house/200801255815052.shtm
采网址--重复,该网址在站点地址库中存在:http://www.anjia.com/house/200901084315896.shtm
采网址--重复,该网址在站点地址库中存在:http://www.anjia.com/house/200901072115890.shtm
采网址--重复,该网址在站点地址库中存在:http://www.anjia.com/house/200812021615815.shtm
采网址--重复,该网址在站点地址库中存在:http://www.anjia.com/house/200812233515871.shtm
靠。。各个列表页面都是这些地址。。。怎么回事啊。。
求助

xiaogougou 发表于 2009-2-26 12:34:00

ali54ls
没人回啊。。

xiaogougou 发表于 2009-2-26 12:59:10

自己顶      ali74ls

xiaogougou 发表于 2009-2-26 13:45:44

upali58ls

xiaogougou 发表于 2009-2-26 14:13:15

ali76ls 顶到高手出现

xiaogougou 发表于 2009-2-26 15:17:49

ali56ls
哎。。。

沦陷今生 发表于 2009-2-26 16:05:41

楼主在 规则列表处,找到采集相同网站的规则,删除那些规则的采集地址库,即可

xiaogougou 发表于 2009-2-27 12:15:27

楼主在 规则列表处,找到采集相同网站的规则,删除那些规则的采集地址库,即可
沦陷今生 发表于 2009-2-26 16:05 http://bbs.locoy.com/images/common/back.gif
老大。 规则列表处 --指的哪里 啊 没找到呢。。
在采集任务上,右键编辑任务   然后呢。。。?

xiaogougou 发表于 2009-2-27 14:56:38

ali75lsali74ls

xiaogougou 发表于 2009-3-3 14:55:03

老大。 规则列表处 --指的哪里 啊 没找到呢。。
页: [1]
查看完整版本: 为什么每个列表页的内容都一样呢