火车采集器软件交流官方论坛

 找回密码
 加入会员
搜索
火车采集器V9版免费下载火车浏览器 - 可视采集,万能群发,全自动脚本工具
查看: 2931|回复: 5

采集时如何保留原文链接?

[复制链接]
发表于 2011-3-1 15:30:33 | 显示全部楼层 |阅读模式
有的源代码上有原文的链接,还好办,可以采集下来


但有的网站上却没有,如何保留原文链接?
发表于 2011-3-1 17:28:28 | 显示全部楼层
采集时如何保留原文链接?
http://www.dataindex.org/forum-viewthread-tid-224-fromuid-2.html

火车头里面这个链接是直接存在数据库里面的。
可以直接从数据库中获取。不过这样有些麻烦。
我来说说我的处理方式。
步骤如下:
1、新建一个采集字段。名字自己写。我一般都用原来的“出处”字段;
2、选择使用正则匹配内容,规则为
(?<content>[\s\S]*?)$
3、保存即可。
发表于 2011-3-1 17:32:18 | 显示全部楼层
本帖最后由 专业收费采集 于 2011-3-15 11:22 编辑

楼主可以参考下我的博文 http://[url]http://board.locoy.com/archives/498[/url]

里面有详细的介绍
发表于 2011-3-1 18:03:36 | 显示全部楼层
唉。。。。。。。
 楼主| 发表于 2011-3-2 16:26:59 | 显示全部楼层
说不尽的感激
发表于 2011-3-11 11:17:13 | 显示全部楼层
懂了……嘿嘿!
谢谢诸位高人了!
您需要登录后才可以回帖 登录 | 加入会员

本版积分规则

企业微信|手机版|Archiver|火车采集器官方站 ( 皖ICP备06000549 )

GMT+8, 2026-5-4 00:34

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表