竟然有这么难采的网站,杯具啊
今天想采集http://zxi.com.cn/的产品内容,他们的防采集功能太到位了,搞了半天还没搞定。后来只好用手工方式采集地址方式才搞定。有高手会采集介绍一下经验,谢谢。 POST分页{:4_197:} 把采集列表网址发下 本帖最后由 zhouchanglin 于 2011-2-17 12:13 编辑列表这样加http://zxi.com.cn/newEbiz1/EbizPortalFG/portal/html/CategoryList.html?ProductMultiCategoryPicker210_action=Searchcategory&ProductPicker_action=Searchcategory&CategoryID=c373e91288637c8c8ffbb83b77a5c110&ProductExhibitList_Mode=button&CompID=ProductExhibitList&CompName=BasicSearchResult&ProductExhibitList_NextPage=分页&ProductExhibitList_OrderField=createDate&ProductExhibitList_Order=descending其中只要改CategoryID=c373e91288637c8c8ffbb83b77a5c110的值就行了,是代表分类,分页网址时可以看到这个参数,取对应的值就可以采分类了,说实话这个地址是我蒙出来的地址
ProductExhibitList_NextPage代表分页
下载的图片没有扩展名,你加jpg扩展名即可正常显示,dos 下可以用命令批量改扩展名,网上搜的今天下载不少腾讯的图片,但都是没有后缀名的图片文件,这样在预览时很麻烦,于是查到这个DOS命令:
举例一、批量修改E:\x目录下的所有文件为jpg格式
ren e:\x\**.jpg
举例二、批量修改E:\x目录下的jpg格式文件为无后缀名(不要忘记最后的点)
ren e:\x\*.jpg *.
举例三、批量修改E:\x目录下的gif格式文件为jpg格式
ren e:\x\*.gif*.jpg
这里只举一些例子,你也可以拓展开用哦
页:
[1]