火车采集器软件交流官方论坛

 找回密码
 加入会员
搜索
火车采集器V9版免费下载火车浏览器 - 可视采集,万能群发,全自动脚本工具
查看: 2455|回复: 3

采集的结果会将原代码中所有原代码中有引号的地方,自动变为双引号,这是怎么回事?

[复制链接]
发表于 2008-7-19 10:20:09 | 显示全部楼层 |阅读模式
所有原代码中有引号的地方,会自动变为双引号
例如 <a href=""/word/53776.aspx"" title=""X9241"" style=""text-decoration:underline;color:blue"">

另外,原代码中本来有一段空白的比如“<p>  去年,”
它会自动加上空格符号变为“<p>      去年”

这样子导致我不能发布,很郁闷,这是啥原因?

而且我明明把<table><tr><td> 这样的标签排除了
可结果中还是有

<table align=""left"">
<tbody>
<tr>
<td id=""Adimg""></td></tr></tbody></table>

[ 本帖最后由 windtime 于 2008-7-19 10:22 编辑 ]
发表于 2008-7-19 11:16:37 | 显示全部楼层
注意看一下你要采的那个网站,火车头是不可能会变的。有的网站在采集的时候可能会有变化的,那是因为人家动态生成防集的。所以。你在写规则的时候多判 定些条件
发表于 2008-7-19 11:47:54 | 显示全部楼层
请将你的规则传上来
 楼主| 发表于 2008-7-19 12:23:36 | 显示全部楼层
大家帮忙看看
我采集另外一个网站是可以入库的
可能是这个网站防止采集了
我该怎么改呢?

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?加入会员

x
您需要登录后才可以回帖 登录 | 加入会员

本版积分规则

QQ|手机版|Archiver|火车采集器官方站 ( 皖ICP备06000549 )

GMT+8, 2025-7-18 06:04

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表