火车采集器软件交流官方论坛

 找回密码
 加入会员
搜索
火车采集器V9版免费下载火车浏览器 - 可视采集,万能群发,全自动脚本工具
查看: 2805|回复: 4

论坛采集时帖子,同一内容地址变化而重复采集,如何解决?

[复制链接]
发表于 2007-12-31 11:37:16 | 显示全部楼层 |阅读模式
比如phpwind 一个帖子在各个分页的时候帖子地址是不一样的.在第二页时候地址后被加上fpage=2,第三页面变成fpage=3,类推.这样在下次更新的时候,部分帖子就会被重复采集发布.其实只要删除掉地址内的fpage=(*),地址可以正常访问,并用不会重复采集.火车头有这样功能吗?
就是对采集下来的地址进行修正.如果有的话,请告知下.非常感谢.本人用的3.2版.
发表于 2007-12-31 12:13:33 | 显示全部楼层
你只采一页就不用重复了
发表于 2007-12-31 12:25:24 | 显示全部楼层
确实是个问题
 楼主| 发表于 2008-1-1 20:46:33 | 显示全部楼层
原帖由 rq204 于 2007-12-31 12:13 发表
你只采一页就不用重复了


汗死.后面的帖子是会被重复顶上来的.
不过目前也只能这样了,采集完了再回头整理一遍.
但希望程序可以改进,必将不是大难度的问题.
 楼主| 发表于 2008-1-1 20:59:46 | 显示全部楼层
同时是否可以考虑添加一些其他的发布内容剔除规则,比如按照采集下来的时间,比仅仅按重复地址要灵活很多。
您需要登录后才可以回帖 登录 | 加入会员

本版积分规则

QQ|手机版|Archiver|火车采集器官方站 ( 皖ICP备06000549 )

GMT+8, 2025-7-19 01:02

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表