发新话题
打印

采集到的有个来源页面

采集到的有个来源页面

采集到的页面里有个
【来源页面】:http://xxxxxxArticle/200407/126.html

怎么去掉这个啊?

这个来源页面好象是火车采集自己本身带来的.不是要采集页面的,而是采集回来后就变成有这条信息了

找了半天没找到

[ 本帖最后由 电脑天使 于 2006-7-13 09:32 编辑 ]

TOP

混倒啊.页面本身没这几个字.过滤都无法过滤.

任务里也没有,这可怎么修改啊?

昏迷啊

TOP

难道采集回来还要修改,一页一页改

TOP

这个没人知道啊

TOP

你先仔细检查一下信息来源网站
如果确实是采集器的问题
还有个解决办法
就是用批量替换工具 这里我推荐replaceking这个免费工具
请上BAIDU搜(怕给的地址失效)

TOP

发新话题
Powered by Discuz! 6.0.0  © 2001-2007 Comsenz Technology Ltd
Processed in 0.209563 second(s), 7 queries, Gzip enabled
当前时区 GMT+8, 现在时间是 2008-11-22 02:01 皖ICP备06000549 清除 Cookies - 联系我们 - 火车采集器官方站 - 静态归档