BUG?规则里没去掉a标签,可是采集后的结果却自动去掉了
本帖最后由 vsgod 于 2013-3-23 00:34 编辑http://www.gpcgd.com/cgxxgg/519327.htm 采集这种页面,里面<a >招标文件下载地址</a>是需要保留的,我在设置规则时,也没排除a标签,内容替换里也不涉及到a 标签,内容替换里对多余的代码进行过滤,出来的效果是<p> <b>广东省立中山图书馆密集架及相关服务采购</b><b>公开招标公告</b>。
火车的设定是不是a标签不能链接到文件呀,要不为什么会自动去掉呢?测试页面时的代码里还是保留着a标签的,一发布就去掉了,很奇怪。 你是发哪呢。请检查采集下来的源代码里有没有A标签 303718 发表于 2013-3-25 11:11 static/image/common/back.gif
你是发哪呢。请检查采集下来的源代码里有没有A标签
我检查过了,采集下来的源代码里没有A标签。我是发布到DESTOON的资讯里的 那肯定是你规则设置错误了,我测试过了没有问题的。
你是不是选了全部排除标签 。 可能我把你“请检查采集下来的源代码里有没有A标签”这句话理解错误了,我的理解是发布出来到DESTOON里面的网页里没有带A标签,就是过滤掉链接了。
在火车头的测试页里,是带有链接的,如你上图。
我的问题是会不会是发布时把链接去掉 了? 那就是在发的过程中被DESTOON排除掉了。请检查发布模块或者DT的程序设置 应该是被destoon自动过滤了,检查一下吧。 非常感谢,我测试下!
页:
[1]