火车采集器软件交流官方论坛

 找回密码
 加入会员
搜索
火车采集器V9版免费下载火车浏览器 - 可视采集,万能群发,全自动脚本工具
查看: 1967|回复: 1

二级网址得不到,请帮忙

[复制链接]
发表于 2008-12-16 21:46:08 | 显示全部楼层 |阅读模式
本帖最后由 cnncnn 于 2008-12-16 21:53 编辑

刚用火车测试一下amazon的列表,发现不能完全采集二级网址,首页(http://www.amazon.com/s/ref=nb_s ... s%3Delectronics&;field-keywords=digital+camera&x=0&y=0)可以得到二级网址,后面的页面要么得不到二级网址,要么采集到的二级网址与首页的重复。
也就是说,即使采100页的一级网址,得到的二级网址始终是一级网址首页采集到的网址。(尽管总数量是对的,但全是重复的)

如,采集地址:
  1. http://www.amazon.com/s/qid=1229431565/ref=sr_pg_(*)?ie=UTF8&rs=172282&keywords=digital%20camera&rh=n%3A172282%2Ck%3Adigital%20camera&page=(*)
复制代码

通配符数字变化范围从:1到100

文章内容页面的地址必须包含:/dp/

采集到的二级网址总数是2400,但实际只有24个,其余全是重复的。

请火车高手帮忙解决,先谢谢了。
发表于 2009-1-5 13:14:00 | 显示全部楼层
二级页面的问题看来很多啊
您需要登录后才可以回帖 登录 | 加入会员

本版积分规则

QQ|手机版|Archiver|火车采集器官方站 ( 皖ICP备06000549 )

GMT+8, 2025-5-21 02:28

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表