请问怎么样将每条采集信息的网址保存
本帖最后由 秋天的无名 于 2010-8-19 16:58 编辑火车头工作是按条件采集某些条的网址的信息,保存后发布的自己网上.我想问一下,比如取得网址的规则是从A页面,得到 a1.a2.a3.....等等页面,然后采集a1.a2.a3....链接的信息,这里,可不可以吧a1.a2.a3.....这些网址,同时存为页面内容标签中的一个标签.比如从a1采到标题标签,时间标签,内容标签,网址标签,而这个网址标签,保存的就是a1.
谢谢高手解答! 可以实现 请问楼上的童鞋,可以实现,到底怎么实现啊 您的需求是无法直接实现的.采集器会从网址列表里里获取内容页地址,然后去采集内容页网址.当前的列表页地址是不会保存的.如果需要保存,需要使用插件,将列表页的源码进行重新处理,然后使用采集器的列表页标签功能,将这个网址保存下来. {:3_151:}谢谢管理员的回复,解决了,可能是我没说清楚,把简单的问题复杂化了,让大家误解.其实非常简单
在网站CMS里面加一个字段存放网址 比如 pageurl然后火车头发布模块这样写,&pageurl=[标签:PageUrl],内容标签什么都不用改,因为数据库里面显示,采集的每条信息的网址,存为了PageUrl 这个变量,不然火车头没办法判断重复网址
页:
[1]