火车采集器软件交流官方论坛

 找回密码
 加入会员
搜索
火车采集器V9版免费下载火车浏览器 - 可视采集,万能群发,全自动脚本工具
查看: 4602|回复: 4

怎么去掉采集页面中的某个地址?[内详]

[复制链接]
发表于 2008-12-7 21:12:49 | 显示全部楼层 |阅读模式
1火车车厢
我准备采集个站,但是他的页面代码里做了防御
比如:
<td rowspan="4"><a target="_blank" href="http:[img]http://www.newyx.net/http://www.newyx.net/www.newyx.nethttp://www.newyx.net/imghttp://w ... .net/3821eb66_s.jpg[/img]"><img src="http:[img]http://www.newyx.net/http://www.newyx.net/www.newyx.nethttp://www.newyx.net/imghttp://www.newyx.net/3821eb66_s.jpg[/img]" width="168" height="120" http://www.newyx.net/><[url]http://www.newyx.net/a&gt;<http://www.newyx.net/td[/url]>
      <http://www.newyx.net/tr>
以上这样的代码
我想去掉代码中的网址干扰"http://www.newyx.net"
请问怎么去掉页面代码中的这个地址?
标签里没排除某些代码的功能啊

最佳答案

查看完整内容

这个是软件的一个bug.. 去掉这个标签的 将相对地址替换为绝对地址~
发表于 2008-12-7 21:12:50 | 显示全部楼层
这个是软件的一个bug..

去掉这个标签的 将相对地址替换为绝对地址~
发表于 2008-12-7 21:36:26 | 显示全部楼层
过滤不行吗?
 楼主| 发表于 2008-12-7 21:47:45 | 显示全部楼层
过滤?内容排除?
内容排除的话不行
发表于 2008-12-9 00:42:21 | 显示全部楼层
你确定有干扰码码?
我测试了,怎么没有看到呀?

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?加入会员

x
您需要登录后才可以回帖 登录 | 加入会员

本版积分规则

QQ|手机版|Archiver|火车采集器官方站 ( 皖ICP备06000549 )

GMT+8, 2024-11-24 22:31

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表