火车采集器软件交流官方论坛

 找回密码
 加入会员
搜索
火车采集器V9版免费下载火车浏览器 - 可视采集,万能群发,全自动脚本工具
查看: 2777|回复: 2

采集地址中有多余内容 如何去除

[复制链接]
发表于 2008-6-2 10:19:55 | 显示全部楼层 |阅读模式
我要采集的是这个页面的内容 http://news.sina.com.cn/society/zq/index.html
新浪的文章代码是<li><a href=/s/2008-06-02/040115662598.shtml TARGET=_blank>德国姑娘为季羡林终身未嫁</a><FONT style="FONT-SIZE:12px"> (2008年6月2日 04:01)</FONT>

我采集到的地址是  http://news.sina.com.cn/s/2008-05-31/010215653087.shtml TARGET=_blank  
请问我如何去除
TARGET=_blank  
发表于 2008-6-2 13:13:28 | 显示全部楼层
用正则吧。自定义下
发表于 2008-6-2 16:36:55 | 显示全部楼层
我不知道你要去掉那段代码是什么意思,  是不能采集吗

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?加入会员

x

评分

1

查看全部评分

您需要登录后才可以回帖 登录 | 加入会员

本版积分规则

QQ|手机版|Archiver|火车采集器官方站 ( 皖ICP备06000549 )

GMT+8, 2026-4-19 00:30

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表