火车采集器软件交流官方论坛

 找回密码
 加入会员
搜索
火车采集器V9版免费下载火车浏览器 - 可视采集,万能群发,全自动脚本工具
查看: 3250|回复: 2

如何逐一采集网页某区域内所有网址呢?并且是一个网址...

[复制链接]
发表于 2017-8-9 12:31:02 | 显示全部楼层 |阅读模式
想采集某论坛,已采集网址,帖子的目标区域特点如下:包含2 - 15个网址,同时包括其他内容,其他内容的排版毫无规律。
我现在只想采集帖子里面这2 - 15个网址,其他内容都不要,该怎么设计采集规则呢?

同时,还希望,根据该帖子所包含网址数量(2 - 15)来决定该页面采集的次数,也即,在数据库里面生成多少条记录,比如有5个网址时,就把每一个网址分别写入数据库里面的“网址”字段,一共生成5条记录,而这5条记录的标题都是帖子的标题。

所以请问,以上采集可以实现吗?谢谢!
发表于 2017-8-9 12:33:33 | 显示全部楼层
先做多页设置区域  再设置标签循环获取 用新记录保存
发表于 2017-8-11 09:27:19 | 显示全部楼层
http://bbs.locoy.com/spider-151384-1-1.html   加上网址中必须包含 “spider” 这样的条件。
您需要登录后才可以回帖 登录 | 加入会员

本版积分规则

QQ|手机版|Archiver|火车采集器官方站 ( 皖ICP备06000549 )

GMT+8, 2024-11-24 19:29

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表