火车采集器软件交流官方论坛

 找回密码
 加入会员
搜索
火车采集器V9版免费下载火车浏览器 - 可视采集,万能群发,全自动脚本工具
查看: 5107|回复: 6

【求助】采集网址深度2时,如何采集1级列表分页的内容

[复制链接]
发表于 2008-3-20 22:27:57 | 显示全部楼层 |阅读模式
采集网址深度2时,如何采集1级列表分页的内容,我只能采集到1级列表第一页的内容,2 3 4 ~~~页面内容采集不到,什么问题????????????希望指点一下,谢谢

这样说是不是明白点呢???????????
比如说设采集深度为2,采集页面为:http://bbs.locoy.com/index.php
开始测试采集网址
采集到下面每个频道地址,采集到频道内部文章列表页的地址

例如:http://bbs.locoy.com/netget-45-1.html资源模块区,此时采集到http://bbs.locoy.com/netget-45-1.html中的所有帖子地址,
但是采集不到其他面的帖子地址
如:
http://bbs.locoy.com/netget-45-2.htm
http://bbs.locoy.com/netget-45-3.html
…………………………
http://bbs.locoy.com/netget-45-44.html


[ 本帖最后由 wfyeshi 于 2008-3-21 14:03 编辑 ]
发表于 2008-3-20 23:28:42 | 显示全部楼层
没明白,你可以使用导出再导入反复操作.
 楼主| 发表于 2008-3-21 13:52:58 | 显示全部楼层
比如说设采集深度为2,采集页面为:http://bbs.locoy.com/index.php
开始测试采集网址
采集到下面每个频道地址,采集到频道内部文章列表页的地址

例如:http://bbs.locoy.com/netget-45-1.html资源模块区,此时采集到http://bbs.locoy.com/netget-45-1.html中的所有帖子地址,
但是采集不到其他面的帖子地址
如:
http://bbs.locoy.com/netget-45-2.htm
http://bbs.locoy.com/netget-45-3.html
…………………………
http://bbs.locoy.com/netget-45-44.html
发表于 2008-3-21 16:27:12 | 显示全部楼层
导出地址再导入地址反复操作
发表于 2008-4-30 23:41:25 | 显示全部楼层
我也遇到了同样的问题,楼上说的不是很明白。分页地址都采集不到不知道怎么导出地址在导入地址?
发表于 2008-5-1 03:07:25 | 显示全部楼层
总之一句话,列表页的文本是不能和正文页的文本用同一个任务采集。

只有分开,第一次采集列表页文本和正文地址。

第二次用这个正文地址采集正文内容。

至于怎么将第一次采集到的正文地址导出并应用于第二次使用,那就各显神通了。

当然,你也可以第一次只采集列表页文本(不采集列表)。
第二次才使用二级采集,采集正文页文本。

以上的结果是采集到两个数据库中,想办法整合。
发表于 2008-5-5 09:10:47 | 显示全部楼层
还是深奥,看不懂哦
您需要登录后才可以回帖 登录 | 加入会员

本版积分规则

QQ|手机版|Archiver|火车采集器官方站 ( 皖ICP备06000549 )

GMT+8, 2025-5-22 13:47

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表