|
|
大家还记得我前面写的给使用火车头采集的朋友们一个忠告一文吧,重新安装火车头采集软件后,我立即重写了女人是衣服网站的采集规则,结果又碰到一点小问题,不知是我的采集规则设置错误,还是火车头采集软件的Bug,如下图:

看到了吧,修改火车头采集规则之前,我的女人是衣服网站所采集来的文章,都被自动添加了H2标签,导致整篇文章的字体都非常大,修改以后,采集的文字正常。
那么,我到底修改了哪些采集规则呢,如下图:

自己写过采集规则的朋友一定看得出来,修改前后的采集规则没有本质的变动,应该不会产生给全文自动添加H2标签的问题,那么这就是我今天的疑问所在了:火车头为什么会自动给采集过来的文章添加多余的标签呢?
不知道这是我的采集规则设置错误,还是火车头采集软件的Bug的缘故。我猜想,会不会是火车头在采集的时候,对某些html标签的过滤和重组合不严格,造成了采集结果的混乱。希望论坛里面的牛X们多提意见^_^
[ 本帖最后由 siting 于 2008-7-12 17:40 编辑 ] |
|