火车采集器软件交流官方论坛

 找回密码
 加入会员
搜索
火车采集器V9版免费下载火车浏览器 - 可视采集,万能群发,全自动脚本工具
查看: 2652|回复: 4

采集过程中遇到%符号的问题

[复制链接]
发表于 2009-5-14 10:25:03 | 显示全部楼层 |阅读模式
【内容】:
     物料帐说明资料 <br />
<table width="300">
    <tbody>
        <tr>
            <td width="20" height="30"><a target="_blank" href="http://www.sapzg.com/zlk/uploads/0912/%E7%89%A9%E6%96%99%E5%B8%9033%E8%AF%B4%E6%98%8E%E8%B5%84%E6%96%99.rar"><img alt="" align="center" border="0" src="/picAure/2009051410175121.gif" /></a></td>
            <td><a target="_blank" href="http://www.sapzg.com/zlk/uploads/0912/%E7%89%A9%E6%96%99%E5%B8%9033%E8%AF%B4%E6%98%8E%E8%B5%84%E6%96%99.rar"><u>[url]http://www.sapzg.com/zlk/uploads/0912/[/url]物料帐33说明资料.rar</u></a></td>
        </tr>
    </tbody>
</table>
   
【时间】: 2009-05-14 10:17:51


----------------------------
上边链接中存在%的字符串是必须的,而又没法替换,在发布到DEDE过程中,发现文章到%就断开了,而且网站框架也乱了,只好人工排版。

出现这个问题,可能不是火车头采集的问题,个人认为可能触动了DEDE的某些标签。
因此,能否在采集过程中替换%的字符串呢?
/%E7%89%A9%E6%96%99%E5%B8%9033%E8%AF%B4%E6%98%8E%E8%B5%84%E6%96%99——这段字符串真烦人
发表于 2009-5-14 13:26:37 | 显示全部楼层
那个是完整的下载地址 如果替换了还能识别下载吗?
使用火车头采集器下载附件  发布地址才会有变化
 楼主| 发表于 2009-5-14 14:27:16 | 显示全部楼层
2# 懷念過去↑文



没想到版主大人会亲自回复,谢谢,选择了探明文件并下载选项后,解决了这个问题。而且文件的路径也出来了,不会再有%字符串了。。。

另外,我在另外一个帖子发的关于DEDE文章含有&随机字符串,造成采集文章发布到目标站点后文章不全,有没有更好的过滤方法?目前我是发布以后浏览,发现有问题的就重新到源文章里头找含有&随机字符串,手动过滤,效果就慢了一些。


---------------
【内容】:
     物料帐说明资料 <br />
<table width="300">
    <tbody>
        <tr>
            <td width="20" height="30"><a target="_blank" href="/oP2er/200905141419038.rar"><img alt="" align="center" border="0" src="/picPure/200905141419037.gif" /></a></td>
            <td><a target="_blank" href="/oP2er/200905141419038.rar"><u>http://www.sapzg.com/zlk/uploads/0912/物料帐33说明资料.rar</u></a></td>
        </tr>
    </tbody>
</table>
   
【时间】: 2009-05-14 14:19:03
-----------------------
发表于 2009-5-14 15:45:12 | 显示全部楼层
选中 urlencode
 楼主| 发表于 2009-5-14 16:28:28 | 显示全部楼层
选中 urlencode
sosome 发表于 2009-5-14 15:45



没有看见这个东东,在哪里选择的???我也想试试
您需要登录后才可以回帖 登录 | 加入会员

本版积分规则

QQ|手机版|Archiver|火车采集器官方站 ( 皖ICP备06000549 )

GMT+8, 2024-11-24 14:05

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表