cxh116 发表于 2009-12-4 16:03:57

多页时多页采集过来的内容不可循环匹配

不得不好火车头太强大了,加上外部PHP编辑接口,简直无敌了.虽然我这功能可以通过PHP外部编程实现,但为了火车头更好发展,才提出来,只是一个小小的逻辑实现问题
拿论坛采集来说,采集http://bbs.locoy.com/spider-42414-1-1.html的内容.我想采集它所有的回复,但想要存在数据库的UBB格式,而不是经过处理的HTML格式,当编辑回复内容时,显示的时UBB代码.
问题是http://bbs.locoy.com/spider-42414-1-1.html这个页面有多个回复,多页匹配只能采集到第一个回复...

流云飞舞 发表于 2011-3-15 15:28:40

我今天研究了以上午,外加下午2个半小时
终于……
知道如何采集本论坛了!

我用分页采集的,现在只求能够采到东西,哎……慢慢来
从菜鸟到现在才几天!

303718 发表于 2011-7-4 14:24:38

多页采集循环匹配可以用插件来弄

lbjyuer 发表于 2016-2-8 17:08:17

历史帖子回顾中。
页: [1]
查看完整版本: 多页时多页采集过来的内容不可循环匹配