creazywing 发表于 2008-10-28 10:32:24

列表式内容页采集,循环匹配,“采集多页”问题

格式为:
日期标题发布者附件
日期标题发布者附件
日期标题发布者附件
日期标题发布者附件
----------------------------------
其中点击“标题”就可以查看内容提要
      点击“附件”就可以开始下载
------------------------------------
我用循环采集可以采集到日期标题发布者附件,并且匹配良好。
但是,如何才能采集到“内容提要”并且与其他内容匹配良好呢?
-----------------------------------
想法:
1。用采集分页的方式,但是因为是列表式的,好像不行。
2.采用“同时采集多页面标签”,但是这种格式好像不能循环匹配,每一个循环采集到的“内容提要”均为第一条的内容提要,不能完成循环采集并匹配。
----------------------------------------
请问,是现在没有这种功能?还是有其他的办法?

请求各位的帮助,谢谢

sushy 发表于 2008-10-28 10:39:30

你这种情况,我以前遇到过。

我当时使用了最笨的方法,分两个任务。
第一个任务:在采集本页的时候,将 点击标题时候的网址单独采集成一个"网址"标签中。

第二个任务:从access中将 网址标签导入到记事本文件中,再进行0级采集,重新采。

这样的做法非常笨啦,但是还算好用。只适合一次采集就能完成的,不适合需要多次更新的。

creazywing 发表于 2008-10-29 09:44:44

谢谢指教。呵呵。如果火车能把同时采集多页面标签改成可以循环匹配的话就更好啦

rq204 发表于 2009-6-10 09:38:17

列表默认就是循环采集的,你将摘要当内容页采就可以了.
页: [1]
查看完整版本: 列表式内容页采集,循环匹配,“采集多页”问题