火车采集器软件交流官方论坛

 找回密码
 加入会员
搜索
火车采集器V9版免费下载火车浏览器 - 可视采集,万能群发,全自动脚本工具
查看: 3804|回复: 3

多页时多页采集过来的内容不可循环匹配

[复制链接]
发表于 2009-12-4 16:03:57 | 显示全部楼层 |阅读模式
不得不好火车头太强大了,加上外部PHP编辑接口,简直无敌了.虽然我这功能可以通过PHP外部编程实现,但为了火车头更好发展,才提出来,只是一个小小的逻辑实现问题
  拿论坛采集来说,采集http://bbs.locoy.com/spider-42414-1-1.html的内容.我想采集它所有的回复,但想要存在数据库的UBB格式,而不是经过处理的HTML格式,当编辑回复内容时,显示的时UBB代码.
  问题是http://bbs.locoy.com/spider-42414-1-1.html这个页面有多个回复,多页匹配只能采集到第一个回复...
发表于 2011-3-15 15:28:40 | 显示全部楼层
我今天研究了以上午,外加下午2个半小时
终于……
知道如何采集本论坛了!

我用分页采集的,现在只求能够采到东西,哎……慢慢来
从菜鸟到现在才几天!
发表于 2011-7-4 14:24:38 | 显示全部楼层
多页采集循环匹配可以用插件来弄
发表于 2016-2-8 17:08:17 | 显示全部楼层
历史帖子回顾中。
您需要登录后才可以回帖 登录 | 加入会员

本版积分规则

QQ|手机版|Archiver|火车采集器官方站 ( 皖ICP备06000549 )

GMT+8, 2024-11-24 21:56

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表