51908 发表于 2008-2-17 21:53:32

3.2sp5。采集得到的结果有重复:

3.2sp5。采集下载地址得到的结果有重复:

http://abcdhttp://abcd,正确的应该是http://abcd。

另,采集多个页面,获得的地址是相对地址,结果就采不了。

[ 本帖最后由 51908 于 2008-2-18 09:57 编辑 ]

小齐 发表于 2008-2-17 22:08:59

我也发现了。这个问题

51908 发表于 2008-2-17 22:42:33

不知其他版本有没有这个问题

rq204 发表于 2008-2-18 10:57:15

具体一下,说下例子,。

51908 发表于 2008-2-18 16:53:14

比如说我想下载个东西,是新开页面里的,得到下载地址应是http://www.abcd.com/XXXX.rar,但火车头出的结果是
[内容]http://www.abcd.com/xxxx.rarhttp://www.abcd.com/xxxx.rar

这样子就下载不了。另外多页面时,有时得到的是相对地址,比如/xxxx.rar,这样也下载不了。

小齐 发表于 2008-2-18 18:18:18

我举个例子吧!
昨天采集A文章1000篇我已经采集发布成功了.
今天采集B文章1000篇,但是问题出现了! 我采集发布以后发现文章结果是2000篇.

这说明我重复采集了1000篇。我现在使用的sp5.

51908 发表于 2008-2-18 20:38:22

试用了一天,无语

[ 本帖最后由 51908 于 2008-2-18 20:47 编辑 ]

lovefox 发表于 2008-2-18 22:10:46

我试用了一天,还没明白怎么弄呢。

小齐 发表于 2008-2-19 07:55:40

我知道我自己的重复,解决方法了.
每次采集都要重新建立一个新站,再导入任务.这样的错不了不.刚明白.

LZ的重复是不是规则没有设置对吧!

飛越無限 发表于 2008-2-19 08:33:31

這個我沒有玩過.小齐我晚上在线的时候你把你的规则发给看一下吧,我这里测试一下
页: [1] 2
查看完整版本: 3.2sp5。采集得到的结果有重复: