火车采集器软件交流官方论坛

 找回密码
 加入会员
搜索
火车采集器V9版免费下载火车浏览器 - 可视采集,万能群发,全自动脚本工具
查看: 3595|回复: 5

象这种无后缀的列表页如何采集

[复制链接]
发表于 2008-1-28 14:45:43 | 显示全部楼层 |阅读模式
发表于 2008-1-28 15:24:32 | 显示全部楼层
 楼主| 发表于 2008-1-28 15:50:21 | 显示全部楼层
问题关键应该不是这个
http://www.momastore.org/museum/ ... 1_11523_11466_-1___(*)/ProductDisplay_Brush Vase_10451_10001_43859_-1_11523_11466_null__

主要是二级目录之后的地址不正确
http://www.momastore.org/museum/ ... roductDisplay_Brush Vase_10451_10001_43859_-1_11523_11466_null__
真实地址应该是
http://www.momastore.org/museum/moma/ProductDisplay_Brush Vase_10451_10001_43859_-1_11523_11466_null__
 楼主| 发表于 2008-2-27 13:08:05 | 显示全部楼层
象这个地址获取的链接
  1. http://www.momastore.org/museum/moma/CategoryDisplay_10451_10001_11451_11628_-1___1_all
复制代码
获得的正确地址应该是
  1. http://www.momastore.org/museum/moma/ProductDisplay_Activity School Bus_10451_10001_46529_-1_11451_11628_null__
复制代码
可现在他总是在采集页面在加上的url以致路径不对 无法采集
多了一个 categorydisplay_10451_10001_11451_11628_-1___1_all

  1. http://www.momastore.org/museum/moma/categorydisplay_10451_10001_11451_11628_-1___1_all/ProductDisplay_Activity School Bus_10451_10001_46529_-1_11451_11628_null__
复制代码
这个采集规则该怎么设置呢?

[ 本帖最后由 eocol 于 2008-2-27 13:09 编辑 ]
 楼主| 发表于 2008-2-27 13:28:22 | 显示全部楼层
他妈的都要崩溃了,这论坛我都翻了几篇没找着 怎么搜啊?
发表于 2008-2-28 13:38:22 | 显示全部楼层
列表页
http://www.momastore.org/museum/ ... 1_11523_11466_-1___(*)

文章页必须包含
http://www.momastore.org/museum/moma/(*)
您需要登录后才可以回帖 登录 | 加入会员

本版积分规则

QQ|手机版|Archiver|火车采集器官方站 ( 皖ICP备06000549 )

GMT+8, 2024-11-18 10:45

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表