vsgod 发表于 2013-3-23 00:32:31

BUG?规则里没去掉a标签,可是采集后的结果却自动去掉了

本帖最后由 vsgod 于 2013-3-23 00:34 编辑

http://www.gpcgd.com/cgxxgg/519327.htm   采集这种页面,里面<a >招标文件下载地址</a>是需要保留的,我在设置规则时,也没排除a标签,内容替换里也不涉及到a 标签,内容替换里对多余的代码进行过滤,出来的效果是<p>&nbsp;<b>广东省立中山图书馆密集架及相关服务采购</b><b>公开招标公告</b>。



火车的设定是不是a标签不能链接到文件呀,要不为什么会自动去掉呢?测试页面时的代码里还是保留着a标签的,一发布就去掉了,很奇怪。

303718 发表于 2013-3-25 11:11:55

你是发哪呢。请检查采集下来的源代码里有没有A标签

vsgod 发表于 2013-3-25 21:38:19

303718 发表于 2013-3-25 11:11 static/image/common/back.gif
你是发哪呢。请检查采集下来的源代码里有没有A标签

我检查过了,采集下来的源代码里没有A标签。我是发布到DESTOON的资讯里的

303718 发表于 2013-3-26 10:10:03

那肯定是你规则设置错误了,我测试过了没有问题的。
你是不是选了全部排除标签 。

vsgod 发表于 2013-3-26 12:07:27

可能我把你“请检查采集下来的源代码里有没有A标签”这句话理解错误了,我的理解是发布出来到DESTOON里面的网页里没有带A标签,就是过滤掉链接了。

在火车头的测试页里,是带有链接的,如你上图。

我的问题是会不会是发布时把链接去掉 了?

303718 发表于 2013-3-26 16:52:55

那就是在发的过程中被DESTOON排除掉了。请检查发布模块或者DT的程序设置

lgp7226 发表于 2013-3-28 14:25:14

应该是被destoon自动过滤了,检查一下吧。

diqiu598 发表于 2013-4-5 12:08:56

非常感谢,我测试下!
页: [1]
查看完整版本: BUG?规则里没去掉a标签,可是采集后的结果却自动去掉了