火车采集器软件交流官方论坛

 找回密码
 加入会员
搜索
火车采集器V9版免费下载火车浏览器 - 可视采集,万能群发,全自动脚本工具
查看: 1714|回复: 3

竟然有这么难采的网站,杯具啊

[复制链接]
发表于 2011-1-4 17:13:53 | 显示全部楼层 |阅读模式
今天想采集http://zxi.com.cn/的产品内容,他们的防采集功能太到位了,搞了半天还没搞定。后来只好用手工方式采集地址方式才搞定。有高手会采集介绍一下经验,谢谢。
发表于 2011-1-4 18:38:44 | 显示全部楼层
POST分页
发表于 2011-1-4 21:00:17 | 显示全部楼层
把采集列表网址发下
发表于 2011-1-4 22:48:42 | 显示全部楼层
本帖最后由 zhouchanglin 于 2011-2-17 12:13 编辑

列表这样加
  1. http://zxi.com.cn/newEbiz1/EbizPortalFG/portal/html/CategoryList.html?ProductMultiCategoryPicker210_action=Searchcategory&ProductPicker_action=Searchcategory&CategoryID=c373e91288637c8c8ffbb83b77a5c110&ProductExhibitList_Mode=button&CompID=ProductExhibitList&CompName=BasicSearchResult&ProductExhibitList_NextPage=分页&ProductExhibitList_OrderField=createDate&ProductExhibitList_Order=descending
复制代码
其中只要改
  1. CategoryID=c373e91288637c8c8ffbb83b77a5c110
复制代码
的值就行了,是代表分类,分页网址时可以看到这个参数,取对应的值就可以采分类了,说实话这个地址是我蒙出来的地址

ProductExhibitList_NextPage代表分页

下载的图片没有扩展名,你加jpg扩展名即可正常显示,dos 下可以用命令批量改扩展名,网上搜的
  1. 今天下载不少腾讯的图片,但都是没有后缀名的图片文件,这样在预览时很麻烦,于是查到这个DOS命令:
  2. 举例一、批量修改E:\x目录下的所有文件为jpg格式
  3. ren e:\x\*  *.jpg
  4. 举例二、批量修改E:\x目录下的jpg格式文件为无后缀名(不要忘记最后的点)
  5. ren e:\x\*.jpg *.
  6. 举例三、批量修改E:\x目录下的gif格式文件为jpg格式
  7. ren e:\x\*.gif  *.jpg

  8. 这里只举一些例子,你也可以拓展开用哦
复制代码

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?加入会员

x
您需要登录后才可以回帖 登录 | 加入会员

本版积分规则

QQ|手机版|Archiver|火车采集器官方站 ( 皖ICP备06000549 )

GMT+8, 2025-8-28 09:07

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表