采集时如何保留原文链接？

goodfree 发表于 2011-3-1 15:30:33

有的源代码上有原文的链接，还好办，可以采集下来

但有的网站上却没有，如何保留原文链接？

solotraveler 发表于 2011-3-1 17:28:28

采集时如何保留原文链接？
http://www.dataindex.org/forum-viewthread-tid-224-fromuid-2.html

火车头里面这个链接是直接存在数据库里面的。
可以直接从数据库中获取。不过这样有些麻烦。
我来说说我的处理方式。
步骤如下：
1、新建一个采集字段。名字自己写。我一般都用原来的“出处”字段；
2、选择使用正则匹配内容，规则为
(?<content>[\s\S]*?)$
3、保存即可。

专业收费采集 发表于 2011-3-1 17:32:18

本帖最后由专业收费采集于 2011-3-15 11:22 编辑

楼主可以参考下我的博文 http://http://board.locoy.com/archives/498

里面有详细的介绍

solotraveler 发表于 2011-3-1 18:03:36

唉。。。。。。。

goodfree 发表于 2011-3-2 16:26:59

说不尽的感激{:4_180:}

流云飞舞 发表于 2011-3-11 11:17:13

懂了……嘿嘿！
谢谢诸位高人了！

页: [1]

火车采集器软件交流官方论坛's Archiver

采集时如何保留原文链接？