多页时多页采集过来的内容不可循环匹配
不得不好火车头太强大了,加上外部PHP编辑接口,简直无敌了.虽然我这功能可以通过PHP外部编程实现,但为了火车头更好发展,才提出来,只是一个小小的逻辑实现问题拿论坛采集来说,采集http://bbs.locoy.com/spider-42414-1-1.html的内容.我想采集它所有的回复,但想要存在数据库的UBB格式,而不是经过处理的HTML格式,当编辑回复内容时,显示的时UBB代码.
问题是http://bbs.locoy.com/spider-42414-1-1.html这个页面有多个回复,多页匹配只能采集到第一个回复... 我今天研究了以上午,外加下午2个半小时
终于……
知道如何采集本论坛了!
我用分页采集的,现在只求能够采到东西,哎……慢慢来
从菜鸟到现在才几天! 多页采集循环匹配可以用插件来弄 历史帖子回顾中。
页:
[1]