查看完整版本: 能否像NC那样获得采集页的网址标签呢?

kankan 2006-5-19 19:49

能否像NC那样获得采集页的网址标签呢?

在NC中,有一个标签就是所采集页面的“网址”,比如采集了[url]http://domain.com/new/123.html[/url],那么网址标签就能获得这个地址。

感觉并不太难,但不知在火车头里该怎么做才能获得。

请注意,偶说的可不是如何采集一个网址,而是如何把网址也作为采集内容的一部分采集到。

火车头 2006-5-19 20:01

火车头里面的网址都是自动识别的。。。你只要定义一下网址中要包含什么就完全可以采到你要的网址

kankan 2006-5-19 21:03

不好意思,我的表达让您误会了:)<br><br>

干脆贴张图,说明我的意思吧。<br>
<br>
对照两张图可知,NC的可用字段标签中包含“网址”一项,这项字段标签的作用就是,如果我们愿意的话,就可以在采集生成的页面中,加入“来源页面:[url]http://domain.com/new/123.htm[/url]。
<br>
<br>[b]虽然火车头的可用标签中也有类似的“网站地址”一项,但两者并不是一样的,火车头获取的只是网站的域名地址,如[url]http://domain.com[/url],而非[url]http://domain.com/new/123.htm[/url]这类的采集页地址。[/b]<br>

不知道这次大家是否能明白偶的意思,嘿嘿,不好意思

[[i] 本帖最后由 kankan 于 2006-5-19 21:10 编辑 [/i]]

火车头 2006-5-19 22:34

又采纳到一条意见。。。

下次模块里可用标签又会多出一个新的----该页网址

kankan 2006-5-19 22:40

爽。

不过,要是急着用的话,可有临时解决办法呢?

sojoy 2006-9-29 12:42

终于找到和我有一样需求的啦 哈哈

有没有什么办法呢?

qzstock 2006-11-30 14:27

我也是这样的问题啊
可以设置一个标签 叫做 [当页地址]  但是好像在[标签:内容]后面直接加:
[标签:内容][标签:当页地址]好像是可以的,但是这样就不能说明我是取自这个地址了,于是我想

[标签:内容][本文转自[标签:当页地址]]  好像就不行了,如果有试成功的朋友说一句

ljjk5 2007-10-2 22:41

[标签:内容][标签:当页地址]好像是可以的
在面[标签:内容]启用过滤,结束代码替换为   本文转自

sojoy 2007-11-11 04:44

呵呵

又有新的要求了

能不能得到采集页的上级网址呢?
页: [1]
查看完整版本: 能否像NC那样获得采集页的网址标签呢?
售前客服QQ: 火车采集器客服 rq204, 火车采集器客服 飞越无限火车采集器客服 孤魂, 联系电话:0551-3495249(技术合作问题) 023-58436018 (08:00-20:00-客服),0752-2553545(09:00-20:00-客服)