发新话题
打印

[3.2版] url变量是字母序列-采集问题

url变量是字母序列-采集问题

http://www.***.com/07/1206/10/3V199VR3001117AG.html
3V199VR3001117AG  是变量       这样的网址应该如何采集?


      建议增加字母变化

[ 本帖最后由 endyfashion 于 2007-12-7 10:38 编辑 ]

TOP

有规律的字母变化倒是可以,但是无规律的字母变化还是不能写成有规律的变量。

您的这个链接,显然是0级页面,那么要想采集1级设置是二级列表,看看能不能搞定啊。总之,没有id=1 id=2这样东西,火车头就难以找出规律,进而就难以采集。

TOP

这样的地址还是采集生成吧,呵呵
火车采集器商业版 咨询、购买、售后支持等 :
火车采集器2008版系列教程正在陆续发布中 :  点击观看
提供高难度采集技术支持,完美实现全站转移,多栏目自动更新
火车采集器采集规则定制:[50元/条,质量保证]
火车采集器发布模块定制:[80元/条,质量保证]
火车采集器程序接口定制:[按程序难度议价,200起]
织梦图片集自动发布模块:[100元/个,自动分析图片代码、远程下载图片]
支持支付宝淘宝安全交易:Q Q: 130775 Mail:vu520@163.com ->查看更多联系方式

TOP

看来只能采列表了

TOP

只是有的网站并不提供这样的列表

TOP

很少见到不提供列表的网站,除非他只有一个页面。

TOP

发新话题
Powered by Discuz! 6.0.0  © 2001-2007 Comsenz Technology Ltd
Processed in 0.117091 second(s), 6 queries, Gzip enabled
当前时区 GMT+8, 现在时间是 2008-10-7 07:29 皖ICP备06000549 清除 Cookies - 联系我们 - 火车采集器官方站 - 静态归档