stima 发表于 2010-3-29 14:24:26

求版主解决!牛站,终于发现火车头无法采集的网站了!

本帖最后由 stima 于 2010-3-29 23:29 编辑

郁闷,今天采集个网站,发现网站火车头一直重复采集 不提示网址重复!
目标网站的列表页 http://price.ccmn.cn/B_info/price_INFO0010_KEY101.html

采集到文章地址30页 是正确的!
文章页面地址 http://www.ccmn.cn/D_info/info_display_501027.html;jsessionid=BjJ3LwJTn08vhYpF6wQqQnNWdLgJXHzvlVG3lt4Jnnf7TGyyzxRk!2131322873
这些也都是正确的, 但是采集发布以后,再来采集一遍,我地址都没有清空,但是火车头重复采集,又是采集到30篇!没有提示网址存在重复!

这是什么原因?为什么这样的地址 检测不出已经存在了!!

大家可以测试一下!!   在线寻求高手解答!

2楼的版主说设置参数,怎么设置呀? 我都看了两天的教程了,都还不没有找到解决的方法!! 检测文章重复那边我有选,
采集这个站点就老是重新采集和发布,都没有提示网址重复!

沦陷今生 发表于 2010-3-29 16:50:09

采集很简单,自定义参数即可

stima 发表于 2010-3-29 21:41:15

怎么自定义参数~~我都发布到我的网站了,可是再点开始又重复采集了!

沦陷今生 发表于 2010-3-29 21:47:54

自定义采集动态地址看看
页: [1]
查看完整版本: 求版主解决!牛站,终于发现火车头无法采集的网站了!