artideaweb 发表于 2009-12-7 14:59:12

大家好,采集内容页是多页,第一页为何采集两次

大家好,采集内容页是多页,第一页为何采集两次
比如:
http://news.t0001.com/2009/1126/article_101005.html
这个文章第一页就采集两次

孤魂 发表于 2009-12-7 15:45:54

分页重复
http://news.t0001.com/2009/1126/article_101005.html
http://news.t0001.com/2009/1126/article_101005_1.html
http://news.t0001.com/2009/1126/article_101005_2.html

artideaweb 发表于 2009-12-7 16:55:57

大家好,采集内容页是多页,第一页为何采集两次
比如:
http://news.t0001.com/2009/1126/article_101005.html
这个文章第一页就采集两次
artideaweb 发表于 2009-12-7 14:59 http://bbs.locoy.com/images/common/back.gif

分页重复有办法解决吗?

砍柴郎 发表于 2009-12-7 17:13:10

如果确实不会的话,也没事,重复的内容程序会跳过。

artideaweb 发表于 2009-12-8 08:29:36



分页重复有办法解决吗?
artideaweb 发表于 2009-12-7 16:55 http://bbs.locoy.com/images/common/back.gif

你说的是重复网址吧?现在是内容有重复的分页
页: [1]
查看完整版本: 大家好,采集内容页是多页,第一页为何采集两次