kankan 2006-5-19 19:49
能否像NC那样获得采集页的网址标签呢?
在NC中,有一个标签就是所采集页面的“网址”,比如采集了[url]http://domain.com/new/123.html[/url],那么网址标签就能获得这个地址。
感觉并不太难,但不知在火车头里该怎么做才能获得。
请注意,偶说的可不是如何采集一个网址,而是如何把网址也作为采集内容的一部分采集到。
火车头 2006-5-19 20:01
火车头里面的网址都是自动识别的。。。你只要定义一下网址中要包含什么就完全可以采到你要的网址
kankan 2006-5-19 21:03
不好意思,我的表达让您误会了:)<br><br>
干脆贴张图,说明我的意思吧。<br>
<br>
对照两张图可知,NC的可用字段标签中包含“网址”一项,这项字段标签的作用就是,如果我们愿意的话,就可以在采集生成的页面中,加入“来源页面:[url]http://domain.com/new/123.htm[/url]。
<br>
<br>[b]虽然火车头的可用标签中也有类似的“网站地址”一项,但两者并不是一样的,火车头获取的只是网站的域名地址,如[url]http://domain.com[/url],而非[url]http://domain.com/new/123.htm[/url]这类的采集页地址。[/b]<br>
不知道这次大家是否能明白偶的意思,嘿嘿,不好意思
[[i] 本帖最后由 kankan 于 2006-5-19 21:10 编辑 [/i]]
火车头 2006-5-19 22:34
又采纳到一条意见。。。
下次模块里可用标签又会多出一个新的----该页网址
sojoy 2006-9-29 12:42
终于找到和我有一样需求的啦 哈哈
有没有什么办法呢?
qzstock 2006-11-30 14:27
我也是这样的问题啊
可以设置一个标签 叫做 [当页地址] 但是好像在[标签:内容]后面直接加:
[标签:内容][标签:当页地址]好像是可以的,但是这样就不能说明我是取自这个地址了,于是我想
[标签:内容][本文转自[标签:当页地址]] 好像就不行了,如果有试成功的朋友说一句
ljjk5 2007-10-2 22:41
[标签:内容][标签:当页地址]好像是可以的
在面[标签:内容]启用过滤,结束代码替换为 本文转自
sojoy 2007-11-11 04:44
呵呵
又有新的要求了
能不能得到采集页的上级网址呢?