火车采集器软件交流官方论坛

 找回密码
 加入会员
搜索
火车采集器V9版免费下载火车浏览器 - 可视采集,万能群发,全自动脚本工具
查看: 2769|回复: 2

火车头采集软件的Bug,or采集规则设置错误?

[复制链接]
发表于 2008-7-12 15:05:28 | 显示全部楼层 |阅读模式
大家还记得我前面写的给使用火车头采集的朋友们一个忠告一文吧,重新安装火车头采集软件后,我立即重写了女人是衣服网站的采集规则,结果又碰到一点小问题,不知是我的采集规则设置错误,还是火车头采集软件的Bug,如下图:

看到了吧,修改火车头采集规则之前,我的女人是衣服网站所采集来的文章,都被自动添加了H2标签,导致整篇文章的字体都非常大,修改以后,采集的文字正常。
那么,我到底修改了哪些采集规则呢,如下图:

自己写过采集规则的朋友一定看得出来,修改前后的采集规则没有本质的变动,应该不会产生给全文自动添加H2标签的问题,那么这就是我今天的疑问所在了:火车头为什么会自动给采集过来的文章添加多余的标签呢?
不知道这是我的采集规则设置错误,还是火车头采集软件的Bug的缘故。我猜想,会不会是火车头在采集的时候,对某些html标签的过滤和重组合不严格,造成了采集结果的混乱。希望论坛里面的牛X们多提意见^_^

[ 本帖最后由 siting 于 2008-7-12 17:40 编辑 ]
发表于 2008-8-2 10:26:38 | 显示全部楼层
规则
发表于 2008-8-3 08:50:41 | 显示全部楼层
估计是你自己网站的原因吧,建议你还是修改一下自己的网站代码。

据我了解,有些BLOG默认标题页是标题为H1,摘要为H2的

评分

1

查看全部评分

您需要登录后才可以回帖 登录 | 加入会员

本版积分规则

QQ|手机版|Archiver|火车采集器官方站 ( 皖ICP备06000549 )

GMT+8, 2026-4-22 00:51

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表