火车采集器软件交流官方论坛

 找回密码
 加入会员
搜索
火车采集器V9版免费下载火车浏览器 - 可视采集,万能群发,全自动脚本工具
查看: 4489|回复: 8

一个是采集重复的问题,一个是采集的内容进入其他版块的问题

[复制链接]
发表于 2007-9-28 09:53:22 | 显示全部楼层 |阅读模式
1.采集的时候标题重复
2.采集发布已经设好了,在版块列表中也设好了发布的栏目,有一部分的内容采进了所选的栏目,另一部分内容进入了别的栏目。
发表于 2007-9-28 10:38:02 | 显示全部楼层
1.重复标题检测.
2.你列表确认刷的ID没错..
 楼主| 发表于 2007-9-28 11:11:42 | 显示全部楼层
原帖由 rq204 于 2007-9-28 10:38 发表
1.重复标题检测.
2.你列表确认刷的ID没错..


1.建议火车头出这个采集重复的功能,
2.试了N次了,并且特别的注意了这个问题,因为这个问题让我把上万条采集信息删掉重新采集的,所以特别特别特别的注意这个事,刷的没错。
发表于 2007-9-28 12:42:33 | 显示全部楼层
1.我们判断的是地址重复,如果标题重复了只能说是源站上有相同的内容
2.选了ID的只会发布到这个栏目,POST的内容格式不会改变,是不是你的接收端文件做了什么判断?
 楼主| 发表于 2007-9-28 12:59:07 | 显示全部楼层
原帖由 火车头 于 2007-9-28 12:42 发表
1.我们判断的是地址重复,如果标题重复了只能说是源站上有相同的内容
2.选了ID的只会发布到这个栏目,POST的内容格式不会改变,是不是你的接收端文件做了什么判断?


我是用的DEDE的4.01,用这个火车头软件有三天了,当发布了SP2后,我用的是SP2内置的rq204的那个模块(用这个模块前我照着孤魂的教程做了一个这样的模块)我采集的是多页的内容,当选好了多页的内容之后,点击“开始测试网址采集”后在测试的地方出现的网址就会多出来(如/list_***_2.html里面会出现3.html里面的网址)
我在发布时是复制的任务,然后再编辑修改“定义在线POST在线全局设置”再修改发布配置,重新刷新栏目,选择新的栏目,再保存,再在发布配置里面再选择栏目,然后就会发到别的栏目里面去。
我不知道是我做的不对,还是哪些步骤有失误,麻烦管理员和版主及高人指正。
发表于 2007-9-28 13:18:15 | 显示全部楼层
你的操作步骤应该没有错误,但是奇怪,怎么会出现这样的事情
 楼主| 发表于 2007-9-28 13:28:08 | 显示全部楼层
原帖由 火车头 于 2007-9-28 13:18 发表
你的操作步骤应该没有错误,但是奇怪,怎么会出现这样的事情

有网址的判断再加上标题的判断就更好了,是不是COOKIES的事
有时编辑发布设置后,所选择栏目会出现文章,没有选择的栏目也会出现文章
 楼主| 发表于 2007-9-28 13:29:42 | 显示全部楼层
我刚刚在一个发布设置上测试了一下:
我发布在ID1的栏目上,我在此基础上编辑了一下想要发布在2上,在两个选择栏目的地方全是ID2的选择,可是全部发到了ID1的栏目里面了。
 楼主| 发表于 2007-9-28 13:31:00 | 显示全部楼层
如果是几个栏目一起采集时发的更是乱78糟
您需要登录后才可以回帖 登录 | 加入会员

本版积分规则

QQ|手机版|Archiver|火车采集器官方站 ( 皖ICP备06000549 )

GMT+8, 2024-11-15 07:51

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表