火车采集器软件交流官方论坛

 找回密码
 加入会员
搜索
火车采集器V9版免费下载火车浏览器 - 可视采集,万能群发,全自动脚本工具
查看: 3389|回复: 7

<求助>向导批量增加地址的疑惑?

[复制链接]
发表于 2008-3-2 00:37:27 | 显示全部楼层 |阅读模式
用3.2的批量增加采集地址

         如果象雅虎知识堂的地址分析来看的话:

         http://ks.cn.yahoo.com/dir/97316767_over_-date_26_26903.html


         http://ks.cn.yahoo.com/dir/97316767_over_-date_51_26903.html


         http://ks.cn.yahoo.com/dir/97316767_over_-date_76_26903.html


         这个地方的通配符怎么写啊?  (*)+1 ?  求助各位大大
发表于 2008-3-2 02:24:35 | 显示全部楼层
第一行: http://ks.cn.yahoo.com/dir/97316767_over_-date_ (*)_26903.html

第二行:1 - (你采集多少页)

第三行:25 (间隔倍数)

[ 本帖最后由 indiboy 于 2008-3-2 02:26 编辑 ]

评分

1

查看全部评分

发表于 2008-3-2 02:26:52 | 显示全部楼层
??不难采啊,楼主解决了吗
发表于 2008-3-2 02:47:14 | 显示全部楼层
这个地址也有蛮多了
 楼主| 发表于 2008-3-2 03:17:35 | 显示全部楼层
还是不太明白 第二行是1的话 采的地址就是25 50 75 而不是26 51 76啊
发表于 2008-3-2 03:24:54 | 显示全部楼层
以下方法都可以
正则提取
分页提取

[ 本帖最后由 沦陷今生 于 2008-3-2 03:25 编辑 ]
 楼主| 发表于 2008-3-2 03:28:11 | 显示全部楼层
都听过 但是对于是菜鸟的我还是比较.....
发表于 2008-3-5 21:52:36 | 显示全部楼层
呵呵

点击采集网址规则=>向导添加=>正则提取=>设置正则参数,

“源地址”填写:http://ks.cn.yahoo.com/dir/97316767_over_-date_1_26903.html

依据该网址的源代码,可以填写以下各项:
源代码的“从”填写:<div class="page">
源代码的“到”填写:</div>
脚本规则填写:/dir/97316767_over_-date_[参数]_26903.html
实际连接填写:http://ks.cn.yahoo.com/dir/97316767_over_-date_[参数1]_26903.html

点击“完成”。好像每次只能提取到页面上写出的10条地址。
用分页采较好。

[ 本帖最后由 ws123 于 2008-6-2 13:24 编辑 ]
您需要登录后才可以回帖 登录 | 加入会员

本版积分规则

QQ|手机版|Archiver|火车采集器官方站 ( 皖ICP备06000549 )

GMT+8, 2026-4-16 14:41

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表