火车采集器软件交流官方论坛

 找回密码
 加入会员
搜索
火车采集器V9版免费下载火车浏览器 - 可视采集,万能群发,全自动脚本工具
查看: 2384|回复: 5

请问怎么样将每条采集信息的网址保存

[复制链接]
发表于 2010-8-18 16:52:40 | 显示全部楼层 |阅读模式
本帖最后由 秋天的无名 于 2010-8-19 16:58 编辑

火车头工作是按条件采集某些条的网址的信息,保存后发布的自己网上.我想问一下,比如取得网址的规则是  从A页面,得到 a1.a2.a3.....等等页面,然后采集a1.a2.a3....链接的信息,这里,可不可以吧a1.a2.a3.....这些网址,同时存为页面内容标签中的一个标签.比如从a1采到标题标签,时间标签,内容标签,网址标签,而这个网址标签,保存的就是a1.
谢谢高手解答!
头像被屏蔽
发表于 2010-8-19 02:57:33 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
发表于 2010-8-19 09:14:23 | 显示全部楼层
可以实现
 楼主| 发表于 2010-8-19 15:57:18 | 显示全部楼层
请问楼上的童鞋,可以实现,到底怎么实现啊
发表于 2010-8-19 16:35:19 | 显示全部楼层
您的需求是无法直接实现的.采集器会从网址列表里里获取内容页地址,然后去采集内容页网址.当前的列表页地址是不会保存的.如果需要保存,需要使用插件,将列表页的源码进行重新处理,然后使用采集器的列表页标签功能,将这个网址保存下来.
 楼主| 发表于 2010-8-19 16:58:29 | 显示全部楼层
谢谢管理员的回复,解决了,可能是我没说清楚,把简单的问题复杂化了,让大家误解.其实非常简单

在网站CMS里面加一个字段存放网址 比如 pageurl  然后火车头发布模块这样写,&pageurl=[标签:PageUrl],内容标签什么都不用改,因为数据库里面显示,采集的每条信息的网址,存为了PageUrl 这个变量,不然火车头没办法判断重复网址
您需要登录后才可以回帖 登录 | 加入会员

本版积分规则

QQ|手机版|Archiver|火车采集器官方站 ( 皖ICP备06000549 )

GMT+8, 2025-7-13 04:13

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表