列表式内容页采集,循环匹配,“采集多页”问题
格式为:日期标题发布者附件
日期标题发布者附件
日期标题发布者附件
日期标题发布者附件
----------------------------------
其中点击“标题”就可以查看内容提要
点击“附件”就可以开始下载
------------------------------------
我用循环采集可以采集到日期标题发布者附件,并且匹配良好。
但是,如何才能采集到“内容提要”并且与其他内容匹配良好呢?
-----------------------------------
想法:
1。用采集分页的方式,但是因为是列表式的,好像不行。
2.采用“同时采集多页面标签”,但是这种格式好像不能循环匹配,每一个循环采集到的“内容提要”均为第一条的内容提要,不能完成循环采集并匹配。
----------------------------------------
请问,是现在没有这种功能?还是有其他的办法?
请求各位的帮助,谢谢 你这种情况,我以前遇到过。
我当时使用了最笨的方法,分两个任务。
第一个任务:在采集本页的时候,将 点击标题时候的网址单独采集成一个"网址"标签中。
第二个任务:从access中将 网址标签导入到记事本文件中,再进行0级采集,重新采。
这样的做法非常笨啦,但是还算好用。只适合一次采集就能完成的,不适合需要多次更新的。 谢谢指教。呵呵。如果火车能把同时采集多页面标签改成可以循环匹配的话就更好啦 列表默认就是循环采集的,你将摘要当内容页采就可以了.
页:
[1]