6045670 发表于 2008-2-6 21:56:32

采集并发布到网站后,标题前多出个被采集站的网址,如何解决?

采集并发布到网站后,标题前多出个被采集站的网址,如何解决?

例如我采集该站 www.xxx.com/qq 栏目下的文章
在他的<title>内只有他的标题 没有网址或别的代码 为什么采集后就在标题前多出个他的网址呢?

被采集的文章如这样 <title>文章标题</title>   采集后就变成了<title>www.xxx.com/qq/文章标题</title>

这是怎么回事啊??   请高手指教



我试过过滤www.xxx.com/qq也没效果   
我试过不采集<title>内的内容 采集别的地方的标题也不可以

fireye 发表于 2008-2-7 00:57:55

规则问题,请楼主仔细检查。

lwj324 发表于 2008-2-20 11:10:11

在设置里面过滤,采集规则本身采用的就是同样字符串代替,你可以把地址用无字符串代替
页: [1]
查看完整版本: 采集并发布到网站后,标题前多出个被采集站的网址,如何解决?